由ChatGPT引发的人工智能风潮还在猛烈地刮着。但从各个视点来看,现在这都是一个巨子争霸的战场:更大的模型、更强的算力、更多的用户、更雄厚的资金……这些都好像成为了想要参加这场比赛的门票。与此同时,核心技能的研讨也逐步敞开走向关闭。
而在这高墙正在筑起的过程中,也有一些新锐的创业公司想要高举旗号来一场革新。其间,特别有目共睹的是一家名为Hugging Face开源创业公司。
现在,Hugging Face现已是全球最受欢迎的开源机器学习社区和渠道,不只创下了GitHub有史以来增加最快的AI项目记载,估值也一路冲破了20亿美元。近期,微柔和浙江大学联合发布的一篇关于HuggingGPT的论文更是把Hugging Face推到了舞台中心,也让更多人重视到了其时这股异乎寻常的人工智能开展力气。
本月初,微软亚洲研讨院和浙江大学联合发布了一项最新的名为HuggingGPT的研讨,介绍了一个全新的协作体系,让开发者可以在ChatGPT的协助下快速、精确地去挑选适宜的人工智能模型,然后完结包含文字、视频、语音等多模态在内的杂乱使命。
该项目现在现已在Github上开源,还有一个超拉风的姓名叫JARVIS(没错,便是跟钢铁侠的帮手一个姓名)。在这个研讨中,首要触及到了两个主体,一个是众所周知的ChatGPT,另一个则是AI社区Hugging Face。
简略来说,Hugging Face是一个针对人工智能的开源渠道,用户可以在上边发布和同享预练习模型、数据集和演示文件等。现在Hugging Face上现已同享了超越10万个预练习模型,1万多个数据集,包含微软、谷歌、Bloomberg、英特尔等各个职业超越1万家组织都在运用Hugging Face的产品。
在HuggingGPT中,ChatGPT经过扮演了“操作大脑”的人物,可以主动解析用户提出的需求,接着在 Hugging Face 的“AI模型池”里进行主动模型挑选、履行和陈述,为开发者们开发更杂乱的人工智能程序供给了极大的便当。
尽管在模型上ChatGPT跟Hugging Face可以牵手,但从本质上来说,Hugging Face跟OpenAI现在是在做两个相反方向的事。其间最大的不同点在于,在开发者服务方面,OpenAI现在正在树立人工智能开发的围墙,仅答应满意条件的组织和个人进入,但Hugging Face则期望每个人都可以拜访生成式 AI 模型,包含各类企业和一切一般开发者。
本年2月,OpenAI上线了一个名为Foundry的新开发者渠道,允户可以在这个渠道上运转OpenAI最新的机器学习模型,但在产品的描绘中,OpenAI清晰表明Foundry是为运转较大作业负载的顶级客户规划,而依据一份价格表显现,即使是 GPT-3.5 的轻量级版别,三个月费用高达7.8万美元,一年费用为 26.4万美元。
就在Foundry发布后,Hugging face便马上宣告了其与 AWS 的最新协作伙伴关系,并发出了“让人工智能走向敞开”的呼吁。经过该协作,任何开发人员都将可以运用 AWS 的保管服务并处理 Hugging Face 上可用的任何模型。
在现在巨子树立的人工智能战场上,Hugging Face就像是一支强有力的民间力气。当巨子们都在尽力坚持自己生成式 AI 的霸主位置的时分,Hugging Face 的方针则是寻觅各种途径来坚持 AI 研讨空间的敞开。
而这样特色也让Hugging Face现在颇有一些“中立”的颜色。不管微软、谷歌、亚马逊、Meta这些大公司打得再剧烈,但它们简直全都是Hugging Face的支持者。
那么,Hugging Face究竟是怎么开展起来的,它详细做着什么样的事务?
在一般人的眼中,人工智能一贯都归于“冷感”很强的技能范畴,不管是充满着许多数字、模型的算法,仍是由各种机械零件组装成的机器人,都难免让人感到有些距离感。但作为专为人工智能开发者服务的Hugging Face却主打了一个反差萌,笑脸Emoji再加上一双摊开的小手,logo甚至有点过份心爱。
之所以有这样一个心爱的logo,是因为一开端Hugging Face做的产品其实是一款针对青少年集体的谈天机器人。
其时Hugging Face的主意是根据自然言语处理 (NLP) 的人工智能技能,来为年青人们开发一个带有娱乐性、相似于电子宠物相同的个性化谈天机器人,让咱们可以在无聊的时分跟它聊八卦、问它问题、让它生成一些风趣的图片之类的作业。
这种新颖的人机交际方式得到了一些重视。2017年3月9号,Hugging Face App在iOS App Store正式推出,并拿到了包含SV Angel、NBA球星杜兰特在内的120万美元的天使出资。尔后一年多,Hugging Face都一向围绕着自己的谈天机器人事务在做着自然言语了解的相关练习并发布相关的产品,顶峰时期每天处理的音讯数量达到了1百万条。在2018年5月,它又获得了400万美元的种子轮融资。
尽管开展的还算不错,但由于其时的人工智能的了解才能和谈天水平远不及ChatGPT这样智能风趣,再加上并非刚需的事务场景,Hugging Face的规划一向都难以扩展。
但为了开发这个谈天机器人,Hugging Face的团队做了一个很重要的事,那便是构建了一个底层库来包容各种机器学习模型和各种类型的数据集。包含协助练习谈天机器人检测文本音讯心情、生成连接的呼应、了解不同对话主题等,并且在GitHub上一向以开源项目的方式继续发布该底层库的一些内容。
就这样不温不火地开展了一段时刻后,2018年末,Hugging Face迎来了一个重要的转机。
当年11月,谷歌宣告推出根据双向 Transformer 的大规划预练习言语模型BERT,瞬间成为了自然言语了解范畴最受开发者重视的模型。但一开端,Google只发布了BERT的TensorFlow版别,Hugging Face就想为啥没有Pytorch版别呢?所以Hugging Face开创人之一的Thomas Wolf就用几天的时刻完结并开源了PyTorch-BERT,但没想到,便是这么一个“无心插柳”的项目让Hugging Face一炮而红。
借着BERT的春风,Hugging Face的Pytorch-pretrained-BERT发布3个多月后,快速达成了在Github上5000+ 星标的成果,到了7月份其Star数量现已超越了1万,开展速度远超其他同类开源项目,在Github的AI项目范畴里一飞冲天。
凭借 Transformers库,开发者可以快速运用BERT、GPT、XLNet、T5 、DistilBERT等NLP大模型,并运用这些模型来完结文本分类、文本总结、文本生成、信息抽取、主动QA等使命,节约许多时刻和核算资源,尔后Hugging Face在人工智能开源范畴的名望也越来越大。
到了2019年12月,Hugging Face拿到了由Lux Capital 领投的A轮融资,融资额也比上一轮上了一个量级达到了1500万美元。值得注意的是,从这一轮开端,Hugging Face的标签开端不再是谈天机器人,而是把AI开源事务放在了首位。这张心爱的笑脸emoji也开端被广阔人工智能开发者们所熟知。
曩昔这些年,人工智能范畴的科研和商业运用是相对独立的两个板块,科研部分的使命便是对前沿技能进行研讨,搞模型、发论文,运用部分的人则是要将最新技能用到产品中探究商业变现。怎么将科研成果进行体系性的整合成为开源产品,让开发者们可以很快上手去运用转化是长时刻困扰业界的一个问题。
Hugging Face之前歪打正着地摸到了这个痛点,接着开端仔细向下发掘。简略来说,Hugging Face便是承当了人工智能科研走向运用这个过程中简直一切杂乱、繁琐、细碎的作业,然后便利任何人工智能从业者都可以去快捷地运用这些研讨模型和资源。
现在,除了头号产品Transformers之外,Hugging Face还树立了Tokenizers、Datasets、Accelerate等库,从模型到数据集、从保管渠道到功能优化,以开源社区为载体,Hugging Face已树立起了完好的人工智能开发生态,包含了 NLP、核算机视觉、语音、时刻序列、生物学、强化学习等各个范畴。
值得注意的是,Hugging Face并不是因为ChatGPT带火的。2022年5月,当商场的注意力都还停留在Web3、元世界之上时,Hugging Face拿到了有红杉、Lux Capital参加的1亿美元融资,让其估值一举突破了20亿美元。
Hugging Face其时的方针是想成为人工智能范畴的Github。其开创团队以为,只需将那些少数人把握的技能推广给更多人运用,才干真实最大程度地推进整个职业的前进。而从商业的视点来说,Hugging Face以为赋能整个AI社区所或许发生的价值或许比一个专有的东西高出千倍,而只需将其间的1%变现就可以足以撑起一个高市值的公司,相似的比如包含MongoDB、Elastic等等。
除了蓬勃开展的开源社区,从2020年开端,Hugging Face也开端做面向企业的定制自然言语模型,其客户包含彭博社、高通、英特尔等各类大中小型公司,并推出了包含AutoTrain、Inference API & Infinity、Private Hub、Expert Support等针对不同开发者类型的产品。据报道显现,从2021年开端Hugging Face就一向处于正现金流的状况。
Hugging Face在其时的人工智能范畴中可以以开源社区的方式异军突起,有一些偶尔也有必定。首要,曩昔这些年,人工智能技能所获得的前进都是由全世界的科研和工业范畴一起协作所推进的,它的技能基因里其实就带着敞开,因而树立起一个渠道来链接研讨者和开发者适应了职业开展的前史和趋势。
此外,Hugging Face经过完结许多的基础性作业,来协助补偿在人工智能范畴里长时刻存在的科学与出产之间的距离,这是曩昔许多开源渠道没有重视和做到的。
在此前的一个采访中Hugging Face的CEO Clément Delangue表明,机器学习技能依然还处于前期开展阶段,开源社区的才能将是巨大的。他以为,在未来5到10年,咱们必定还会看到更多开源机器学习公司的兴起。
注:封面图来自于hugging face,版权归于原作者。假如不同意运用,请赶快联络咱们,咱们会当即删去。