9 月 24-26 日," 2024 中国汽车供应链大会暨第三届中国智能网联新动力汽车生态大会"在武汉市举办。本届大会由中国汽车工业协会和东风汽车集团有限公司蚁合把持,以"新挑战、新对策、新机遇——推动中国汽车供应链可捏续发展"为主题,共建树 1 场闭门会议、1 场大会论坛和 4 场主题论坛等 6 场会议,并有供应链发展讨教发布、鼎新收尾推介、香港车博会及论坛、中国汽车供应链协同鼎新寰宇行首站(东风汽车站)等一系列发布或配套行动。其中,在 9 月 25 日下昼举办的"主题论坛二:构建供应链重生态——鼓吹智能网联汽车新发展"上,科大讯飞股份有限公司阛阓与照看有规划部总司理祝敏发表精彩演讲。以下履四肢现场发言实录: 科大讯飞股份有限公司阛阓与照看有规划部总司理 祝敏 感谢协会提供这个平台,在中国汽车重镇、在东风的大本营有契机和寰球疏导。刚才听了张院长的共享,我深受启发,刚才罗文告长讲了汽车的内卷。讯飞处在汽车的内卷,在 AI 和东谈主工智能的内卷。我早上还在看,在我来之前,昨天和今天凌晨差异向大模子作念了发布,Open AI 的大模子也作念了迭代,讯飞在昨天作念了一个小迭代,大的会在咱们的 1024 作念迭代。今天能有半天的时辰和寰球进行共享,听诸君行业大咖共享,是幸福的事情。底下我给寰球先容讯飞在智能座舱的践诺和的不雅点。 2022 年 Open AI 发布了 3.5 之后,引来了国内的百模大战,寰球看到东谈主工智能有 3 个身分,算法、数据、算力。算法在 70 年代还是出现了面前通盘的算法,简直迎来大的飘摇是在互联网期间积蓄的数据,还有现时 AI 算力大界限的发展和迭代。 讯飞从创业于今一直从事 AI 和东谈主工智能界限,并不是从发布之后才作念剖析大模子,在很早之前,讯飞有一个寰宇剖析的重心实验室,Open 让寰球看到大模子在这么的数据和算力的情况下,它不错终了智能涌现,是以寰球加大了这一块的干预。 2023 年 5 月 6 日到本年 6 月份,讯飞大模子经验 7 次迭代,张院长刚才讲到算力很贵,对讯飞来讲不仅算力很贵,讯飞莫得算力,讯飞从 2019 年以后继华为后被好意思国制裁,咱们一直在相配有限的情况下作念咱们的大模子研发。在前年 8 月份之前,咱们一直用千亿界限的参数,来 PK 别东谈主万亿界限的参数效果,在 8 月份之后华为算力卡出来,讯飞蚁合华为作念了国内首个万卡级自主算力平台的大模子,面前达到 GPT-4 特地的水平,改日在 1024 在 10 月份行将发布下一个版块,对标 GPT-4O。 在座舱界限,咱们一直在想大模子能给座舱带来什么变化?它的中枢价值在何处?咱们以为在两个场合,一个是东谈主机交互,一个是场景鼎新,再大的模子、再好的效果用在车上是什么效果,照旧要看场景。我从这两个场合先容一下讯飞的会通和主见。 借着咱们的星火 4.0,咱们对讯飞座舱东谈主机交互全链路作念了优化和调整,领先是快,寰球讲"一快遮百丑",寰球看到悉数反馈速率,联系于大模子没上之前,是有一个浮现的减慢,体验相配不好。咱们在讯飞 4.0 基础上作念了相配多的优化,端到端,作念到平均效应速率 1.5 秒以内,这一块的数据在捏续作念优化。另外,在多语种和方言上,让咱们用户不仅仅用渊博话,还不错用方言,还不错是多语种,你说的时候,它反馈的即是方言和多语种。多方法多模态超拟东谈主交互,领先要看到你,感知到神采和心思作念出对应的交互,包括超拟东谈主的交互反馈。 咱们在畅想东谈主机交互的末端,车可能会变化一个贾维斯,变形金刚,包括轰隆游侠,什么是贾维斯式的交互?咱们以为在多模交融勾通大模子的摆脱交互,为汽车注入类东谈主化的方法,可能是改日的场合。在前几天阿里云栖大会上,斑马的蔡先生也提到,什么时候在汽车座舱上出现 iPhone 时刻?我以为这一天详情会来,但现时还远远莫得达到这个进度,我确信大模子会给咱们 iPhone 时刻作念助力和赋能。 除了灵巧,这咱们会通这个伙伴还应该具备个性化的特征,所谓个性化,要感知现时车东谈主上的特征,勾通东谈主脸感知车上是一个小孩、成东谈主或者老东谈主,给出不相同的场景和交互。其次,要左证使用的顾虑和风尚作念出对应的交互,包括作念一些个性化的声息伴随。 勾通大模子,当你问它的时候它无所不成,需要星火匡助,能给反馈。比如我可爱垂钓,问这个地方合乎垂钓吗?勾通大模子,和定位,给出淡薄,勾通多模态的大模子和定位作念的场景和应用。 下一代 AI 座舱和场景需要什么样的时间身分?现时在云表的大模子量相配大,在车上用的本钱高,悉数调用受云表辘集链路的影响,面前好多车企和咱们悉数作念端云勾通,终点是端侧的大模子。说到端侧的大模子,咱们现时在车上的时间平台就相配紧要。面前跟着国产的算力平台的发展,在算力方面还是简略给咱们提供相配好的相沿。多模态的输入和输出,在车上岂论是用原本的触摸键交互,照旧语音交互,够不上多模态的交互。 咱们在现存材干基础上作念了一些场景先容,这些场景是咱们从讯飞角度提供的淡薄,包括咱们作念的旅行、健康、好意思食、影视,包括车上的 K 歌,底下从以上方面作念先容。 车上的健康,咱们和车厂蚁合打造健康座舱的见识,寰球知谈恒久开车,包括亚健康的东谈主群,他们的健康需要非常诊疗,咱们想考在出行流程中何如更好督察车主的健康?咱们不错在车上作念几件事,领先是对疾病的预警,寰球知谈面前车上搭载了 DMS 的录像头,通过无感的探伤,不错作念心律、血氧、血压、呼吸频率检测,不错检测近十种疾病的探伤;还有慢病检测,不错捏续检测,给出对应的淡薄。包括在一些迫切问题出现的时候,不错问大模子,作念迫切提拔。 随行 KTV,面前车上搭载 K 歌比例相配高,近一两年出现无麦 K 歌,勾通车上的语音收音进行 K 歌,讯飞不错作念 AI 伴奏索求,当你听一首歌的时候,你想唱,不错去原声,也不错去女声、去男音,不错和蔡依林悉数齐唱。包括买了新车何如使用? 用车学问,包括车上的符号,故障灯亮了是什么风趣风趣?咱们不错勾通多模态的感知。包括出现问题的时候,不错进行场景保举,包括给出对应的谜底。 包括千里浸式出动影厅,比如我不记起电影称号,不错左证电影场景哄骗大模子进行百科。 讯飞提供的 AI 时间也好,提供的应用也好,会和车企合营,以节略简略的模式搭载。咱们面前渐渐往多域交融场合走,咱们中央单位处理材干越来越强,作念集会化,一个单位有好多协助处理器。跟着降车本,还有信息安全条件下,咱们会渐渐把好多算法,包括大模子,往土产货去放。现时讯飞是先在一个 SOC 上把全栈 AI 终了部署,包括车上用到语音的、图像的、终了的,包括音响音效,像智驾,移植到一个 SOC 上,有一些终澄澈量产,有一些正在和车厂蚁合开拓当中。包括剖析大模子语音和端配合部署的有规划,和好多车厂合营,咱们打造悉数车上的 AI 底座,助力打造智能汽车平台。 咱们在落地流程中也际遇了好多问题,在这里抛砖,比如传统语音与大模子配合、衔接何如作念协同?在车上土产货场景下大模子不一定有传统语音好,何如作念均衡?接入大模子后何如作念拒识?咱们在作念落地化干预了大王人的元气心灵。现时有好多车厂作念探索,把语音和土产货端侧大模子、云表大模子作念了拆分,可能是两三家供应商共同作念这个事情,除了集成的难度,还有大模子的材干强,关联词要商量土产货识别,关于土产货识别来讲,面前关于大模子土产货化之后短长常大的挑战。 讯飞是 1999 年建树,是中国第一家大学生创业的上市公司,有 2 个国度重心实验室。咱们的业务除了寰球熟知的语音、大模子,还在作念智能音效、智能座舱,在汽车界限深耕 21 年,面前量产托付的车型跳跃 1400 个,基本上国内的车企王人有合营,猖狂 2023 年年底前段搭载跳跃 5700 万台,面前在 6000 多万台。 讯飞在中国汽车出口流程中,给国内品牌提供了多语种支捏,面前有跳跃 23 个语种,和国内主要车企出海王人有合营。车上音响音效,面前作念了车上的音响音效,全栈的算法王人是讯飞自研,搭载从低端到高端多个平台,100% 的国产平台亦然在开拓当中。在这几年的合营中取得了跳跃 14 家国内主流车企 30 多个车型的定点,储存了 300 多万台的装载量。除此除外,讯飞基于国产的芯片平台,像黑芝麻、华为,作念咱们我方的智驾照看有规划,基于纯视觉的有规划。讯飞基于大模子在作念车企数字化有规划,包括涵盖研发,代码助手、销售界限、客服界限、用车界限,王人有居品的秘籍。 谢谢! (注:本文左证现场速记整理,未经演讲嘉宾审阅) |