创新奇智,做工业制造的ChatGPT

行业新闻 2023-04-06

  “AI+制造”新探索。

  3月31日,“AI+制造”第一股创新奇智发布2022年全年财报。财报显示,创新奇智在2022年营业期内收入15.58亿元,同比增长80.9%;毛利额达5.07亿元,毛利率32.6%,同比增长89.7%。

  后疫情时代,主攻制造业AI的创新奇智,能够取得这样的成绩实属不易。

  人工智能正在进入GPT-4开启的AI 2.0时代。李开复认为,AI 2.0时代带来的变革将会是移动互联网的十倍,人类的生产方式将会被改写,生产力水平也将大大提高。AI 2.0在制造、金融、零售、医疗、文娱等产业都具有非常大的市场应用空间,人工智能的新一波商业潜能有望在各行各业加速点燃,进而提升人类整体智能化水平。

  以ChatGPT为代表的AI 2.0正在给制造业带来新的机遇。通过通用人工智能(AGI)和生成式人工智能技术(AIGC),可以帮助工业企业更快地构建符合具体场景的小模型,以满足各个生产环节对AI的需求,比如可以快速生成高质量生产数据,指导机器人或产线完成各种复杂的任务,实现更高水平的人机协作。

  只是,与过往智能制造在推行时候的难点相似,工业领域的AI 2.0在AI能力和行业积累上也有很大的门槛,需要长期聚焦制造业积累行业Know-How。而创新奇智显然就是其中之一。

  成立于2018年的创新奇智,由李开复的创新工场亲自孵化,自创立之初就关注AI技术的商业化落地,重点聚焦“AI+制造”领域。

  一方面,创新奇智在计算机视觉和机器学习两个AI领域都有深入研究;另一方面,创新奇智过往在钢铁冶金、面板半导体、3C高科技、工程建筑、汽车装备、能源电力、食品饮料及新材料等各个工业领域都有大客户服务案例,累计客户数量超过400家。

  2022年1月,成立不到4年的创新奇智便在港股上市,市值110亿港元。

  上市一年后,创新奇智的业务收入持续增长。即使过去一年有疫情影响,创新奇智客户营收上“AI+制造”业务版块收入依旧达到9.48亿元,同比增长111.2%,营收占比从2021财年的52.2%提升至60.9%。

  这种增长情况,无疑体现了制造业对AI的渴求。创新奇智也在财报中提到,2023年公司将继续聚焦制造业、积极布局AIGC。

  日前,「甲子光年」对话了创新奇智CTO张发恩,共同交流了在AI 2.0时代下,创新奇智如何在制造业里通过AIGC为客户赋能。

  1.大模型与工业预训练大模型

  虽然与“AI四小龙”一样,创新奇智也关注图像识别领域、有金融行业的业务;但不同于“AI四小龙”以安防等智慧城市为核心业务,创新奇智的主营业务是制造业AI。

  谈及将AI应用于制造业,张发恩觉得:“AI 1.0时代,AI凭借感知、预测、决策能力,已经可以完成许多不同种类的任务”。

  例如在汽车装备领域,创新奇智通过AI技术和对行业的理解,向客户提供全生命周期智能自动化解决方案,包括汽车智能工厂、新能源智能基地、半导体数字化装配车间、离散自动化工业产线和高端装备配套。通过来料质检、生产质量控制和产品出厂检查实现全流程循环管理,实时获取质量状况并识别问题以快速改善。并且,数据可以在各个部门共享,以追溯产品质量。

  但是,“AI+制造”的进展比预期来得缓慢。客户对AI的接受程度有限、部署的时间和经济成本较高是主要原因,而疫情让制造业的产能和资金链面临着较大风险,也阻碍了AI更快在制造业的推进。

  以ChatGPT为代表的AI 2.0的出现,让AI开始拥有预测、决策、感知的能力。兴奋之后,所有人也都在期待,大模型是否能在to B领域也出现有效可行的应用。

  大模型在垂直领域的能力已经被证明。

  微软在3月22日提交的关于GPT-4的测试论文《Sparks of Artificial General Intelligence: Early experiments with GPT-4》中提到,在使用GPT-4来做小学数学、高中数学、大学数学题时,均超过了专门解决数学问题的模型Minerva。

  不过,具体到大模型在各个细分领域的实际,还需要行业头部的公司来发起探索。

  创新奇智在AI技术探索上有持续投入。

  根据 IDC 发布的《2022上半年中国人工智能软件及应用市场研究报告》,创新奇智在计算机视觉应用市场份额晋升到第 4 名,机器学习平台市场份额持续位居第 4 名,是唯一在两大 AI 技术分支同时名列四强的企业。

  凭借AI能力,创新奇智正在创新地研发“工业预训练大模型”。物如其名,“大模型”、“工业”和“预训练”是这个模型的特色。

  首先,这个模型足够“大”。

  AI生成的内容,要达到或者超过人类水平,如文案、图像等,从学术和工业实践上看,往往需要有生成式预训练大模型(GPT),例如驱动ChatGPT的预训练大模型参数数量有1750亿。

  张发恩认为,面向行业和面向客户的预训练大模型会成为一个必然需求。 技术上,一些先进的技术(例如LoRA)能够有效地使用低算力技术训练千亿、百亿级别参数的大模型。

  同时,与现有大模型相似的是,创新奇智的工业预训练大模型也使用了Transformer架构。在算力方面,创新奇智对算法进行了优化,让大模型在小算力的情况下依旧可以运行。用业内的话说,“模型越大潜力越大,而大模型的能力可以通过精简过的较小的模型来达到”。

  其次,这个模型是针对“工业”的。

  除了大模型都会使用到的通用数据之外,创新奇智还将过往累积的工业数据加入大模型的训练之中。这将成为工业大模型在工业领域超越通用大模型的决定因素。

  对于各个细分领域的巨头来说,数据——无论是经营数据还是生产数据——都是公司的商业壁垒。在云计算和SaaS被广泛使用的今天,在工业和许多传统行业里,巨头都更愿意在本地部署自己的服务,而不希望把数据放在云上,承担数据泄露的风险。新兴的技术对于这些企业来说只是锦上添花,但企业不会为了AI 2.0下尚未成型的功能就上交自己的数据。

  与此同时,工业是一个行业Know-How极强的领域,每个细分领域都有自己的知识,在智能化过程中,每个相似的环节都需要根据对行业的理解来重新设计。但这些知识是通用大模型没法凭空生成的,所以,只有服务工业企业、又积累了行业Know-How的公司能够设计出针对工业的大模型。

  而这,也将成为行业大模型更有效果、更快应用的原因。

  2.小样本学习 更适合工业场景

  人工智能领域有一个有趣的现象叫做莫拉维克悖论,指的是机器和AI学习的发展经常会与人类不同,也即机器容易学会一些人类觉得很难的事情,但又很难学会一些人类觉得很容易的事情。

  在工业领域,莫拉维克悖论更频繁地凸显。

  例如,机器在替代人类做复杂运算的时候表现很好,但学会做流水线上的工作却需要很久。

  这也是过去十年里智能制造推进时候遇到的核心难点——工业的每个细分领域都千差万别,而训练机器完成一项固定的工序却需要大量时间和成本。

  但是,未来在预训练大模型的加持下,小样本学习将让AI在这个领域产生突破。

  在过去,机器学习中也有“迁移学习”的能力。例如,现有一套程序是用来做面板缺陷检测的。当人希望把程序变成检测另一种类型的面板,或者另一种类型的缺陷时,只需要根据现有的模型进行改写,并且输入少量的样本,即可把之前的程序迁移为新的程序。

  而现在,由大模型蒸馏出的小模型则更进一步。通过创新奇智的工业预训练大模型,结合新场景和新需求,依旧只需要少量几百张的样本量,就可以生成符合对应场景的小模型。

  与之前不同的是,“迁移学习”只考虑了测试结果的有效性,并没有关注缺陷检测这个需求在整个生产流程中的成因和相互联系。但通过大模型所蒸馏出的小模型,拥有工业的背景知识,能够更好地达成目标。

  对于所有行业来说,工业也是小样本学习技术最适合的场景。因为工业场景中每个环节都有所不同,需要新的小模型来辅助完成;但每个环节之间又相似关联,可以通过预训练大模型来蒸馏。

  张发恩做了一个形象的比喻:“大模型就像是一个巨型的航空母舰,小模型就像是从航空母舰发射出去的一架架小飞机。在航空母舰上可以搭建多样的小飞机,来完成不同的任务”。创新奇智正在做的,一方面逐步推进大模型航空母舰的研发,同时不断打造针对垂类场景的一架架小飞机。

  除了生成符合具体功能的小模型之外,创新奇智工业预训练大模型还可以生成“数据”,也即通过对现有样本的学习,源源不断地创造新的样本,从而可以提升工业领域样本不足情况下的模型精度。

  结合小样本技术和AI样本数据生成功能,仅需少量场景数据辅助描述,便可生成大量针对该场景的样本数据用于模型训练,最终大大降低工业领域AI模型的生产应用门槛和模型生产成本。

  张发恩估计,利用大模型、小样本学习和AI数据生成技术,预计可以使客户节约50%的费用,训练时间有望降低到原来的1/3。不过在当前,这三者都还不够成熟完善,仍处于探索阶段,也都需要持续的实践经验和数据的补充。

  不过,创新奇智已经表现出在AIGC上投入的决心。基于工业预训练大模型、小样本学习和AI数据生成技术,创新奇智研发了面向工业的AIGC产品—AInnoGC。AInnoGC除了拥有样本生成的能力,应用在能源电力、半导体检测领域之外,还拥有产线布局生成能力,可以帮助工厂自动规划生产产线、帮助仓储区域优化布局。

  另外,AInnoGC还拥有智能解答的功能,能够在AI实训中心,基于现有的工业知识图谱,用对话的方式解答学员的问题,帮助新入职的技工更快了解工作内容。

  3.坚持研发创新 2~3年后AI 2.0在工业领域爆发

  3月31日,创新奇智发布2022年全年财报。在2022年营业期内收入15.58亿元,同比增长80.9%;毛利额达5.07亿,毛利率32.6%,同比增长89.7%。

  相比起2018年,创新奇智客户的客户营收上“AI+制造”业务版块占比从36.6%上升到了60.9%,达到9.48亿元。财报中也提到2023年将继续聚焦制造业、积极布局AIGC。

  但依旧不变的是在研发方面的投入。从2021年的3.3亿元增长了27%达到2022年的4.2亿元,研发占收入比例为25%。

  虽然,企业扣除股份支付及上市开支等项目后的经调整依旧净亏损1.38亿;经调整净亏损率为8.9%,但这个数字较2021年度降低7.6个百分点,同比缩窄46.1%。

  目前,创新奇智的AInnoGC已经在半导体、能源电力、智造实训等领域实现了应用。

  在半导体领域,硅片生产过程中,可以通过AInnoGC平台模拟不同产线工艺差异,生成大量高质量硅片崩边、缺角、裂纹、线缝的缺陷样本,以更高质量、更准确地进行缺陷检测。在能源电力领域,AInnoGC可以自动生成大量风电设备磨损、倾斜的图像,来帮助风电大组件实现未来的智能预警和精准判断。

  相较于传统AI公司或大模型公司,创新奇智坚持“AI+制造”两边都深耕的策略,既关注AI发展,又关注行业积累。张发恩预计,2~3年之后,AI预训练大模型和数据生成、小样本学习等技术就会逐步完善、达到理想状态,届时AI在工业界的应用将会有显著的爆发。

  这次以ChatGPT为代表的AI 2.0的浪潮下,创新奇智入局工业AIGC,并非一时兴起。早在2017年谷歌团队发布关于Transformer架构的论文《Attention is What You Need》之后,创新奇智研发团队的成员就已经开始关注此项架构,在公司成立之后也有专项研究。在近日根据智慧芽数据库检索出的《中国人工智能大模型企业发明专利排行榜(TOP 50)》,创新奇智大模型发明专利位居35名。

  工业AIGC既是行业大模型的大势所趋,也是创新奇智坚持的研发路径。对于类ChatGPT的技术,创新奇智的态度是“拥抱它”“应用它”“发展它”。 在3月31日晚的业绩沟通会上,创新奇智管理层明确表示,要牢牢把握全球数字化经济和中国制造智能化转型加速的增长机遇,同时会积极地投入拥抱AI 2.0浪潮,继续务实高效的做好技术、产品、场景、商业的平衡发展,做好大模型技术应用的创新旗帜。

  通用大模型正在以天为单位迅速发展当下,未来具体的应用还需要靠深耕行业的服务商来实现。未来,每个行业都会有自己的ChatGPT,而创新奇智要在AI 2.0时代里做制造业的ChatGPT。

相关文章

发表评论