橘子百科-橘子都知道橘子百科-橘子都知道

高峰:从 私域AI到具身智能

高峰:从 私域AI到具身智能

专题:2024中国AIGC创新发展论坛

  2024年(nián)服贸会专题论坛(tán)之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举(jǔ)行。智子引擎产品副总裁高峰出席并演讲。

  高峰介(jiè)绍,和大多数(shù)大模型企业一样,过去一年,智子引(yǐn)擎在垂直领域中做了很多落地项目,但经过内(nèi)部复盘,发现很多多模态大模型的能力其实还没有被企业充分利(lì)用。传(chuán)统企业和(hé)我们(men)AI大模型公司之间,似乎隔着一层“窗户纸”。因此,公司 决定走一条艰难但有效(xiào)的路,这条路就是(shì)私(sī)域AI。“我(wǒ)们重新思考(kǎo),企业与(yǔ)AI公司的关(guān)系不应该是供需关系,而应是(shì)共创(chuàng)关系”。

  “积跬步,行(xíng)千里”,高峰(fēng)说,开发私域AI解决方案的过(guò)程(chéng),也是在(zài)帮助Awaker逐步认(rèn)识和理解世界。“我相信,当我(wǒ)们(men)积累到一定程度时,先进的生产力将会爆发 ,而那(nà)时我们就可以进行更(gèng)为先进的通用层(céng)面的整合。那将是一个新的时机,作为一个技术创新(xīn)型企业,我们更多的是把自己定(dìng)位在创(chuàng)新领域,推动AI给产业的(de)赋能”。

  以下(xià)为(wèi)演讲实录:

  高峰:尊敬的各位来宾,大家好!非常荣幸能代表智子引擎科技有限公司分(fēn)享我们(men)的科研成果,今天我演讲的主题是(shì)《从私域AI到具身智能》。

  首先,我想谈谈过去一(yī)年我们所做的(de)工作。和大多数大(dà)模型企(qǐ)业一样,我们(men)在垂直(zhí)领域中做了很多落(luò)地项目,但经过我们内(nèi)部的复盘,发现很多多模态大模型的能力其实还没有被(bèi)企业(yè)充 分利用。传统企业和我们AI大(dà)模型公司之间,似乎隔着一层“窗户纸”。因(yīn)此,我们决 定走一条艰难但有效的路,这(zhè)条(tiáo)路就(jiù)是私域AI。我们重新(xīn)思考,企业与AI公司的关系不应该是供需(xū)关系,而应(yīng)是共创关系。

  接下来,我将从四个方面展开我的分(fēn)享。首先,请(qǐng)允许我简(jiǎn)单介绍一下我们公(gōng)司。

  智子引擎科技有限公司(sī)的科研人员 主要来自(zì)中国人民大学(xué)高瓴人工智能学院(yuàn),我们的核心团队曾(céng)参与(yǔ)智源研究(jiū)院的悟道·文澜项目。我们研发了(le)国产首个国产多(duō)模态大模型(xíng)。

  接下来介绍一下我们的“孩子”——Awaker,中文名叫觉醒者。我(wǒ)们希望Awaker能像(xiàng)人的大脑一样进行(xíng)思考决策,赋予(yǔ)企业流水线和机器以生命。Awaker可以像普通人一样(yàng)思考,也(yě)可以像(xiàng)领域专家(jiā)或技术(shù)工人一(yī)样思考。它由三部分能力组成:对话能力、检 索能力(lì)和生(shēng)成能(néng)力。你可以从拟人化的角度来理解它,它(tā)能够对话,能 够感知外部环境,但这种感知基于数据进行。Awaker还能生成我们需要(yào)的(de)一些指令(lìng),涵盖感知、理解、决策、规划和控制。这些(xiē)能力可以应(yīng)用于有形的 硬件(jiàn),比如四足(zú)机器人(rén)或两(liǎng)足(zú)机器(qì)人,也可以应用于(yú)无形(xíng)的系统,比如程序大脑、企业大脑,甚至私(sī)人管家。重(zhòng)点(diǎn)在于Awaker如何感知、理解(jiě)、决策、规(guī)划并最终实现控制。

  感知可以通过语言交流,也可以通过声音传感器接收音频信(xìn)号,当然还包括温度、湿度等复杂(zá)的传感器(qì)。Awaker通过多模态数据融合理解 外界信息,基于(yú)之前学习的知识进行决策和规划。如果是在硬件上,它可以(yǐ)控 制机械臂;如果是在软件系统中,它可以控制API,执行各种(zhǒng)操作。

  这就是我们所谓的“多(duō)模态输入、多模态输出”架构(PPT图示)。输入形(xíng)式是多模态的,比如文本问答、图片问答(dá)、声音(yīn)问答。在专(zhuān)业领域,还包(bāo)括通过传感器采集的数据。Awaker通过多模态融合 理解这些数据后(hòu),能进行决策 、规划和控制。

  前面提到的共创关系,意味着企业不只是提供数据,而是提供学习素材。大模型通过学习这些素材得到只(zhǐ)是。大(dà)模型出厂时,可能就像一个有强烈求知欲望的孩子,但(dàn)如果 没有学习材料,它仍只是一个普通的(de)孩子。我们和企业共创,打造先进的生产 工具。私域AI为企业(yè)提供的不仅是降本增效,更是(shì)提升核心竞争力的关键。

  接下来,我讲(jiǎng)一个(gè)实际案例——无人机巡检。传统无人机通(tōng)过摄像头(tóu)、激光雷达等传感器采集农场数据,传输(shū)到大模(mó)型数(shù)据分析中心,检测农作物是否异(yì)常。如果异常,传统小模型会直(zhí)接发出警告。而Awaker具备农业领域的知(zhī)识,它不(bù)仅(jǐn)能识别(bié)病(bìng)虫害,还能生成一整套解决方(fāng)案,告诉维修人员需要用什么农药、喷洒多少、具体喷洒(sǎ)位置,并通过API下发工(gōng)单给(gěi)相关人员。如果配备了喷洒农药的无人机(jī),Awaker可以(yǐ)直接生成(chéng)报告,并下发任务,自动规划喷洒路径并执(zhí)行(xíng)作(zuò)业。

  这套框架还可应用于搜救任(rèn)务,如无人机通过传感器感知受灾区域并(bìng)生成救援路径。

  第二个(gè)例子,我们(men)先看一段视(shì)频。

  (现场播放视(shì)频)

  通过这(zhè)个(gè)视频大(dà)家可以看到,企业内部的(de)系统大多是通过点击功(gōng)能模块来进行操作的。而(ér)在AI时代,我们提前预置了指令(lìng)。大模型能够理解自然语(yǔ)言,在(zài)刚才演示的变电站案例中,控制的最(zuì)小动作其(qí)实(高峰:从私域AI到具身智能shí)是通过API来实现的。用(yòng)户发出的自然语言(yán)指令被系(xì)统理解(jiě)为中文,之后与原子动作相关的API进行匹(pǐ)配,并最终输出结果。对于大(dà)模型来说,这没有什么神秘之处(chù),关(guān)键在(zài)于企(qǐ)业需要(yào)为大模型提供学习材料,比如相关的知识文档。大(dà)模(mó)型(xíng)能够自主学习这些(xiē)内(nèi)容,从而(ér)提升其能力。

  接下来谈一下我(wǒ高峰:从私域AI到具身智能)们的未来规划 。我们希望与传统企业共创,走私域(yù)AI解决方案这 条路。虽然过程中可能(néng)会遇到(dào)很多不(bù)确定性,但(dàn)先进的生产力和优秀的解决方案,往往是(shì)在双(shuāng)方紧密合作中迸发(fā)出(chū)来(lái)的。如果仅仅是供需关系,企业(yè)可能只会将(jiāng)自己(jǐ)认知范围内的(de)问(wèn)题交给 大模型处理 ,但真正有效的合(hé)作是(shì)要让大模型参与(yǔ)到企业的核心生 产流程中,重塑(sù)整个流水线和生产环境(jìng)。如果(guǒ)结合云边协同,整个大(dà)模型将变得(dé)更加强大,因为 城市中的摄像头、巡逻车、无(wú)人机等都会成为大模型的传感器,城市中各个单位(wèi)的工作职责和路(lù)线关系都可能因此发生变(biàn)化。

  “积跬步,行千里”,我(wǒ)们开发私域AI解决方案(àn)的过(guò)程,也是在帮(bāng)助Awaker逐(zhú)步认识(shí)和理解世 界。我相信,当我们积累到(dào)一定程(chéng)度时(shí),先进的生产力将(jiāng)会爆发(fā),而那时我(wǒ)们就可以进行更为先进(jìn)的通用层面的整合。那将是一个新的时机,作为一个技术(shù)创新(xīn)型企业,我们更多(duō)的是(shì)把自己(jǐ)定位在创新领域,推动AI给产业的赋能。

  最后,我真诚期望有更多的合作伙伴加(jiā)入到我们的AI事 业中,与(yǔ)我们共同打(dǎ)造新质生 产力,推动先进流水线的发展。我的分享到此结束,感谢大家的聆听。

  新浪声明:所有会(huì)议实(shí)录均为现场速记(jì)整理(lǐ),未经(jīng)演讲者审阅,新浪网登载此文出于传递更多信息之(zhī)目的,并不意味着赞(zàn)同其(qí)观点或证实其描述。

责任(rèn)编(biān)辑:梁斌 SF055

未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能

评论

5+2=