硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西
“大家好,我是刘强东,今天是(shì)不是看起来(lái)有些不同?很久(jiǔ)没直播,还有些许紧张(zhāng)……话不多(duō)说,老刘(liú)的数(shù)字直播带货(huò)现在开始。”4月16日(rì),京东创始(shǐ)人刘强东在京东平台开启数字人直播。
“东哥”数字人直播,迅速引起广泛关注,数字人替代真人直(zhí)播的时(shí)代来(lái)临了吗?
4月(yuè)18日,数字人头部厂商硅(guī)基智(zhì)能创始(shǐ)人司(sī)马华鹏接受了(le)《每日经(jīng)济新(xīn)闻》记者的专访。司马华鹏表示:“刘强东这次数字人直播,对(duì)我们(men)行业(yè)是非(fēi)常大的品牌宣传。他使用(数字人直播),说明这(zhè)个行业得到了一次(cì)非常重要的认可。”
对于AI的使(shǐ)用,司马华(huá)鹏建议:“未来所有使用AI的人,应该专注到人类特有的(de)东西,比如创意,比如(rú)有(yǒu)温度的东(dōng)西(xī)。”
拆解数字人(rén)技术
“数字人刘强东”是否有硅基智能技术的支持?司马华鹏表示:“我们不太方便(biàn)对外公开(kāi),但这些技(jì)术最早的开创者肯定是我们。我们在(zài)整个(数字人)直播上大概有40多项发明专利(lì),在申请(qǐng)的也有几(jǐ)十项。现在行业内有(yǒu)很多在使用我(wǒ)们的技术(shù)授权,也有很多在(zài)使用硅基智能的API(应用程序编程接(jiē)口)。”
“东哥”数字人(硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西rén)究(jiū)竟是(shì)如何打造出来的?司(sī)马华鹏介绍:“它(数字人)这些内 容是用AI渲染出来(lái)的。如果现在想做东哥同款,你需要提供几分钟的视频。然后我们会将其训练(liàn)成一个数字人模型。这个数(shù)字人模型背后,将由大模型(xíng)驱动它。定时去上一些产品、定时回复一些客户需求、定时作一(yī)些记录,这些(xiē)都是事先做好的剧本,这些(xiē)剧本实(shí)质(zhì)由大模型驱(qū)动,比较接近于人类的行为和(hé)反馈。”
那么,除了上述AI渲染技术(shù)外,数字人直播还需要哪些技术支持?司马华(huá)鹏称:“我们的大模型是多(duō)模态的,是文本生成、声音生成和数字人生成的结合。其(qí)实很(hěn)多人在反(fǎn)馈,他(刘强东)声音和(hé)节奏感与他原来讲话(huà)不太一样。这很可能 克隆的是平时的语速(sù),但是直播(bō)(过程中(zhōng)),一个用户停留时(shí)长是比较短的,你必须(xū)在很(hěn)短时间内把大量的(de)信息披露出来,所以必须把声音放得快一些。”
对于语音合成技术,司马华鹏表示:“我们全(quán)部技术都是自己的。从目前端到端的生成来讲,(语音(yīn)合成)已经(jīng)是一(yī)个非常成熟的(de)技(jì)术。”
数字人形象(xiàng)、语音合成,都是(shì)外在展现形式,数字人直播内容仍旧离不硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西开文本。对于文本,司马华鹏称(chēng):“文本大模型方面(miàn),我们(men)基本上都 是原创的技术,最(zuì)近‘炎帝’大模型(xíng)刚刚通过网信(xìn)办的备(bèi)案。”
能否替代真人直播?
目前,大家看到的直播带货,很可能就是数字人。司(sī)马华鹏介绍:“我们在(zài)2021年开创AIGC直播的大方向,(刘(liú硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西)强(qiáng)东数(shù)字人)基本上是我们2023年产(chǎn)品能够呈现出来的效果,这样的直播间我们(men)已经卖掉(diào)了上万(wàn)个,京东、淘宝(bǎo)、抖音、快手和(hé)视频号(hào)平(píng)台都有。”
真人直播会面临各种复杂场景,特别是情感交流,数字人可以做到吗?司马华(huá)鹏(péng)表(biǎo)示:“我们(men)在看(kàn)东哥(gē)直播的时候,会不会把他(数字人)当作真正(zhèng)的东哥来看,这是决定数字人智能化程度的重要标志。从开播到现在,行业有(yǒu)非常多的(de)评价,大家觉得还是能看到一些机械的痕迹。”
“这个(数字人)行业发(fā)展的核心就是‘看不出(chū)来’。”司马华鹏强调。
其认(rèn)为:“我们现在也有大(dà)量(liàng)的(de)直播间,效果比(bǐ)这个(gè)(刘强东数字人)要好很多。如果他这个直播不是在自(zì)家平台,而是在其他平台,很容易被机器(qì)识别(bié)出来(lái),很快就会被限流。”
因此,在(zài)司马(mǎ)华鹏看(kàn)来,数字人行业的核心是让整个直播间符合图灵测试。对于数字人(rén)行业的发展,其认为:“(该(gāi)领域)图灵测试1.0是分不清(是人类还(hái)是AI);图灵测试2.0则是双向情感交互(hù);图(tú)灵测(cè)试(shì)3.0就是‘死生相契’,未来我们与AI之间(jiān),可(kě)能是Soul Mate(心灵伴侣)的(de)关系,它是你非常重要的助手、朋友,也(yě)可能是你亲密的合作伙伴。”
目前,很多问答式大模型主要给受众提供专业类辅助,但若诉诸情感,是否兼具图像、声音和(hé)文本的多模态大模型(xíng)更具优势?对此,司马华鹏表示认可。“人类大脑的设计中,90%以上是针对图形,所以我们说有(yǒu)图有真相。基于文本,产生的是想象力,(阅读文本)的能力确实非常(cháng)重要(yào),但对大(dà)部分人而言,(自己的(de)大脑)生(shēng)成图片,然后再想象出一个空间(jiān),还原出(chū)这个东西,是非常累的。因此,多模态或者视频化交(jiāo)互能力,能够大大降低我们之间信 息沟(gōu)通对应的脑力消耗。”
对于未来AI电商的形态,司(sī)马华鹏认(rèn)为,未来更大的价值是专(zhuān)业性。比如说,假设(shè)我们(men)在(zài)食品领域有一个很好的AI专家,它(tā)可(kě)以从数据、算法(fǎ)的角度给(gěi)我们提供很多的专业(yè)内容(róng)。这样的专家,它带(dài)来的影响力会超过现(xiàn)有的人类(lèi)专家(jiā),这会带来真正的、更好(hǎo)的电商交易。
其进一步解释称:“人类在做很多(duō)行为的时候,有一定的偏颇或者偏见,或者(zhě)带有一定的商业目的。而以数字和算法驱动的AI专(zhuān)家,会成为我们的朋(péng)友、我们的伙伴(bàn),很(hěn)有可能成为AI电商(shāng)未(wèi)来的主流。现在这些成本还比(bǐ)较高,只是出现在奢侈品领域。我希望未来每一类小产品上,都有这样一个专家顾(gù)问(wèn),来给我们提供非常好的沟通(tōng)交流方式。这是AI电(diàn)商未来非(fēi)常重要的一部分。”
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了