高峰:从私域AI到具身智能
专题:2024中国AIGC创新发展论坛
2024年(nián)服贸会专题论坛(tán)之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举(jǔ)行。智子引擎产品副总裁高峰出席并演讲。
高峰介(jiè)绍,和大多数(shù)大模型企业一样,过去一年,智子引(yǐn)擎在垂直领域中做了很多落地项目,但经过内(nèi)部复盘,发现很多多模态大模型的能力其实还没有被企业充分利(lì)用。传(chuán)统企业和(hé)我们(men)AI大模型公司之间,似乎隔着一层“窗户纸”。因此,公司 决定走一条艰难但有效(xiào)的路,这条路就是(shì)私(sī)域AI。“我(wǒ)们重新思考(kǎo),企业与(yǔ)AI公司的关(guān)系不应该是供需关系,而应是(shì)共创(chuàng)关系”。
“积跬步,行(xíng)千里”,高峰(fēng)说,开发私域AI解决方案的过(guò)程(chéng),也是在(zài)帮助Awaker逐步认(rèn)识和理解世界。“我相信,当我(wǒ)们(men)积累到一定程度时,先进的生产力将会爆发 ,而那(nà)时我们就可以进行更(gèng)为先进的通用层(céng)面的整合。那将是一个新的时机,作为一个技术创新(xīn)型企业,我们更多的是把自己定(dìng)位在创(chuàng)新领域,推动AI给产业的(de)赋能”。
以下(xià)为(wèi)演讲实录:
高峰:尊敬的各位来宾,大家好!非常荣幸能代表智子引擎科技有限公司分(fēn)享我们(men)的科研成果,今天我演讲的主题是(shì)《从私域AI到具身智能》。
首先,我想谈谈过去一(yī)年我们所做的(de)工作。和大多数大(dà)模型企(qǐ)业一样,我们(men)在垂直(zhí)领域中做了很多落(luò)地项目,但经过我们内(nèi)部的复盘,发现很多多模态大模型的能力其实还没有被(bèi)企业(yè)充分利用。传统企业和我们AI大(dà)模型公司之间,似乎隔着一层“窗户纸”。因(yīn)此,我们决定走一条艰难但有效的路,这(zhè)条(tiáo)路就(jiù)是私域AI。我们重新(xīn)思考,企业与AI公司的关系不应该是供需(xū)关系,而应(yīng)是共创关系。
接下来,我将从四个方面展开我的分(fēn)享。首先,请(qǐng)允许我简(jiǎn)单介绍一下我们公(gōng)司。
智子引擎科技有限公司(sī)的科研人员主要来自(zì)中国人民大学(xué)高瓴人工智能学院(yuàn),我们的核心团队曾(céng)参与(yǔ)智源研究(jiū)院的悟道·文澜项目。我们研发了(le)国产首个国产多(duō)模态大模型(xíng)。
接下来介绍一下我们的“孩子”——Awaker,中文名叫觉醒者。我(wǒ)们希望Awaker能像(xiàng)人的大脑一样进行(xíng)思考决策,赋予(yǔ)企业流水线和机器以生命。Awaker可以像普通人一样(yàng)思考,也(yě)可以像(xiàng)领域专家(jiā)或技术(shù)工人一(yī)样思考。它由三部分能力组成:对话能力、检 索能力(lì)和生(shēng)成能(néng)力。你可以从拟人化的角度来理解它,它(tā)能够对话,能够感知外部环境,但这种感知基于数据进行。Awaker还能生成我们需要(yào)的(de)一些指令(lìng),涵盖感知、理解、决策、规划和控制。这些(xiē)能力可以应(yīng)用于有形的 硬件(jiàn),比如四足(zú)机器人(rén)或两(liǎng)足(zú)机器(qì)人,也可以应用于(yú)无形(xíng)的系统,比如程序大脑、企业大脑,甚至私(sī)人管家。重(zhòng)点(diǎn)在于Awaker如何感知、理解(jiě)、决策、规(guī)划并最终实现控制。
感知可以通过语言交流,也可以通过声音传感器接收音频信(xìn)号,当然还包括温度、湿度等复杂(zá)的传感器(qì)。Awaker通过多模态数据融合理解 外界信息,基于(yú)之前学习的知识进行决策和规划。如果是在硬件上,它可以(yǐ)控制机械臂;如果是在软件系统中,它可以控制API,执行各种(zhǒng)操作。
这就是我们所谓的“多(duō)模态输入、多模态输出”架构(PPT图示)。输入形(xíng)式是多模态的,比如文本问答、图片问答(dá)、声音(yīn)问答。在专(zhuān)业领域,还包(bāo)括通过传感器采集的数据。Awaker通过多模态融合 理解这些数据后(hòu),能进行决策 、规划和控制。
前面提到的共创关系,意味着企业不只是提供数据,而是提供学习素材。大模型通过学习这些素材得到只(zhǐ)是。大(dà)模型出厂时,可能就像一个有强烈求知欲望的孩子,但(dàn)如果没有学习材料,它仍只是一个普通的(de)孩子。我们和企业共创,打造先进的生产 工具。私域AI为企业(yè)提供的不仅是降本增效,更是(shì)提升核心竞争力的关键。
接下来,我讲(jiǎng)一个(gè)实际案例——无人机巡检。传统无人机通(tōng)过摄像头(tóu)、激光雷达等传感器采集农场数据,传输(shū)到大模(mó)型数(shù)据分析中心,检测农作物是否异(yì)常。如果异常,传统小模型会直(zhí)接发出警告。而Awaker具备农业领域的知(zhī)识,它不(bù)仅(jǐn)能识别(bié)病(bìng)虫害,还能生成一整套解决方(fāng)案,告诉维修人员需要用什么农药、喷洒多少、具体喷洒(sǎ)位置,并通过API下发工(gōng)单给(gěi)相关人员。如果配备了喷洒农药的无人机(jī),Awaker可以(yǐ)直接生成(chéng)报告,并下发任务,自动规划喷洒路径并执(zhí)行(xíng)作(zuò)业。
这套框架还可应用于搜救任(rèn)务,如无人机通过传感器感知受灾区域并(bìng)生成救援路径。
第二个(gè)例子,我们(men)先看一段视(shì)频。
(现场播放视(shì)频)
通过这(zhè)个(gè)视频大(dà)家可以看到,企业内部的(de)系统大多是通过点击功(gōng)能模块来进行操作的。而(ér)在AI时代,我们提前预置了指令(lìng)。大模型能够理解自然语(yǔ)言,在(zài)刚才演示的变电站案例中,控制的最(zuì)小动作其(qí)实(高峰:从私域AI到具身智能shí)是通过API来实现的。用(yòng)户发出的自然语言(yán)指令被系(xì)统理解(jiě)为中文,之后与原子动作相关的API进行匹(pǐ)配,并最终输出结果。对于大(dà)模型来说,这没有什么神秘之处(chù),关(guān)键在(zài)于企(qǐ)业需要(yào)为大模型提供学习材料,比如相关的知识文档。大(dà)模(mó)型(xíng)能够自主学习这些(xiē)内(nèi)容,从而(ér)提升其能力。
接下来谈一下我(wǒ高峰:从私域AI到具身智能)们的未来规划。我们希望与传统企业共创,走私域(yù)AI解决方案这条路。虽然过程中可能(néng)会遇到(dào)很多不(bù)确定性,但(dàn)先进的生产力和优秀的解决方案,往往是(shì)在双(shuāng)方紧密合作中迸发(fā)出(chū)来(lái)的。如果仅仅是供需关系,企业(yè)可能只会将(jiāng)自己(jǐ)认知范围内的(de)问(wèn)题交给大模型处理,但真正有效的合(hé)作是(shì)要让大模型参与(yǔ)到企业的核心生产流程中,重塑(sù)整个流水线和生产环境(jìng)。如果(guǒ)结合云边协同,整个大(dà)模型将变得(dé)更加强大,因为城市中的摄像头、巡逻车、无(wú)人机等都会成为大模型的传感器,城市中各个单位(wèi)的工作职责和路(lù)线关系都可能因此发生变(biàn)化。
“积跬步,行千里”,我(wǒ)们开发私域AI解决方案(àn)的过(guò)程,也是在帮(bāng)助Awaker逐(zhú)步认识(shí)和理解世界。我相信,当我们积累到(dào)一定程(chéng)度时(shí),先进的生产力将(jiāng)会爆发(fā),而那时我(wǒ)们就可以进行更为先进(jìn)的通用层面的整合。那将是一个新的时机,作为一个技术(shù)创新(xīn)型企业,我们更多(duō)的是(shì)把自己(jǐ)定位在创新领域,推动AI给产业的赋能。
最后,我真诚期望有更多的合作伙伴加(jiā)入到我们的AI事业中,与(yǔ)我们共同打(dǎ)造新质生 产力,推动先进流水线的发展。我的分享到此结束,感谢大家的聆听。
新浪声明:所有会(huì)议实(shí)录均为现场速记(jì)整理(lǐ),未经(jīng)演讲者审阅,新浪网登载此文出于传递更多信息之(zhī)目的,并不意味着赞(zàn)同其(qí)观点或证实其描述。
责任(rèn)编(biān)辑:梁斌 SF055
未经允许不得转载:橘子百科-橘子都知道 高峰:从私域AI到具身智能
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了