大模型时代，「重识」云知声

首页 > 滚动 > > 内容页

大模型时代，「重识」云知声

发表于: 2023-05-25 09:37:33 来源：商业新知网

在山海大模型发布会现场，黄伟有一句话令人印象深刻，“云知声的过去十年，就是为山海而生。

作者| 皮爷

(资料图片仅供参考)

出品|产业家

“谁能做成中国最好的大模型？”在今年3月一个北京投资人的内部分享会上，有人满怀期待地提出这样一个问题。但可惜，这个问题没有答案，或者说没人可以论证自己的答案。

在过去的几个月时间里，伴随着ChatGPT这款现象级产品的出现，大模型的热度只增不减，不论是互联网大厂，还是新兴的互联网创业者，抑或是传统AI企业，推出的大模型如雨后春笋般出现在市场。

根据不完全统计，今年3月以来，中国市场已经出现超过30款大模型产品，其覆盖领域除了固有的通用大模型，更有专门面向细分赛道的中模型（产业模型），如低代码、工业、能源等等。

但两个月过去了，文章开篇的问题依旧没有答案。

几个最现实的问题是，伴随着大模型数量的增加，市场对大模型产品本身抱有更现实，或者说更审慎的态度，即大模型究竟能解决什么问题？在智能对话、逻辑推理之外，大模型距离能落地到真实的产业场景，还有多远的路要走？它需要多久才能转化为真正的社会生产力？

问题背后，对应的不仅是市场对大模型产品的深度思考，也更是对当下中国数字化、智能化未来的方向探索。大模型产品背后的企业需要用更落地的动作，完成自证。

最近，产业家连线了云知声创始人兼CTO梁家恩博士，从他的视角来理解这次大模型浪潮到底意味着什么，以及对云知声，这家AI赛道的老兵而言，它正在交出的是一张怎样的答卷。

在他和云知声看来，变化和自证，已然在路上。

一、云知声，「交卷」

511分——这是在云知声大模型发布现场，云知声创始人黄伟公示的一个分数。它是云知声山海大模型能在临床执业医师医学考试中拿到的分数，这个考试总分是600分，而参加考试的考生平均分是365分。

在医疗领域，MedQA评测也超过81分，这是一张超过GPT-4的成绩单。

“我们想经过领域增强训练，让大模型在专业领域从本科训练到博士。”梁家恩告诉产业家。而在医疗领域，这个想法正在落地。

这也正是这次云知声山海大模型发布会的不同之处。即在市面上大模型现场展示的语言对话能力、逻辑推理能力之外，山海大模型传出的声音也更多在集中产业层面，比如医疗、家居、教育、汽车等多个产业领域。

以医疗领域为例，人们不仅可以基于某个病症获得准确的医疗答案，在临床中，医生更可以通过语音生成病历关键词，在山海大模型的辅助下，基于病历辅助医生生成完整的病历方案；同时也更可以帮助患者和保险公司进行医疗相关的保险理赔。

再比如在物联网领域，山海大模型可以实现主动智能、情感化回复以及多轮复杂对话等等，像钢铁侠里的“贾维斯”一样帮助人们安排日程，成为智能物业管家。

此外，山海大模型还可以成为特定领域的“销售专家”“知识管理专家”“口语专家”等等，基于大模型对特定的产业场景进行深度赋能。

“现在基本上OpenAI等机构列出的开源英文语料类别和中文语料类别，我们都已经进行了训练，还增加了自己的中文和医疗数据。”梁家恩告诉我们。

根据云知声的“U+X”战略，山海大模型交出的这张答卷不仅在通用大模型的“肌肉”上，如常规的语言生成、语言理解、逻辑推理、数据和代码能力、安全合规能力，也更在具体的产业落地上，即通过插件扩展、领域增强和企业定制，在专业的产业领域实现更针对性的落地和适配。

这是一张怎样的答卷？

二、从专用到通用，路径背后的AI TO B

“比如如果OpenAI通用能做到95分，但很多专业领域可靠性还达不到实用化要求；我们的通用基座可以做到90分，然后会优先在不同领域分别进行强化，最终能在领域里落地。”梁家恩表示。

伴随着OpenAI的持续大火，在人们惊叹AI迎来转折点的同时，一些隐性的问题也更在出现，比如对GPT模型而言，其目前更展现的价值点在通用板块，如对语义的理解，逻辑推理等等能力，但在具体的产业侧，它必须要进行针对性的训练才能满足基本要求。

其中，医疗是当下人们谈论最多的领域，作为一个“严肃”的学科和领域，其医疗对大模型在训练过程中出现的“幻觉”现象可谓是零容忍，换言之，如果大模型想要在医疗领域落地，就必须进行足够专业的数据训练和微调，才能实现“产业化”。

也可以说，如果说金融行业是数据库等国产厂商能力自证的高地，那么医疗作为复杂度和知识密度极高的行业，恰可以看作是大模型具备产业赋能能力的最强磨刀石。

“在此之前，我们做了大量的医疗智能化案例，有大量的医疗数据积累，以及全面的知识图谱能力，这是我们预先选择医疗方向的基础。”梁家恩告诉我们。

这是云知声一直选择出击的方向。以云知声的「医疗语音录入系统」为例，其可以让医生通过说话实时把文本录入到希望输入的地方，解决固有的“一边交流，一边记录病历”的问题，释放医生在病历誊写上的时间。

据了解，这套系统的语音识别准确率达到 95% 以上，尤其在神经科、免疫内科、血液科、普通内科等疑难杂症患者多的科室应用效果好，个别科室的语音识别率甚至超过 98%。

类似的医疗智能化案例在过去几年是云知声发力的主要方向之一，而这些智能化的解决方案和数据如今都被训练到山海大模型中。据了解，接下来，山海大模型将在国内头部三甲医院陆续落地。

和医疗类似，物联网也是云知声山海大模型重点落地的一个方向。基于大模型的能力，云知声可以在原有的AIOT生态基础上做到智慧物联3.0。同样的，这项能力如今也已经在部分智慧产业园区等场景中逐渐落地。

医疗、物联网对应的方向也恰是云知声在走的大模型路径——由专用走向通用。即相较于在通用大模型的底座上不断进行通用数据叠加，云知声的做法是在底层通用底座的基础上，直接到专用（产业）领域进行针对化的训练，“逐步把每个领域都做到博士水平”，最终反哺底座大模型实现更为准确的产业表达。

实际上，这恰是最符合当下产业落地的大模型路径。即真正从产业的问题和实际情况出发，进行相应的产业模型表达，通过一个个专业领域的模型能力沉淀，最终做到底座大模型的“通用化”和“专业可靠”。

此外，伴随着产业数据的不断涌入，云知声通过优化后的框架和梳理过的高质量数据，保证大模型具备“抗臃肿”属性的同时，实现模型的准确度和产业服务能力。

“数据并非越多越好，包括学术界大家也在讨论，在达到一定的数据量后，模型的准确度和效果就不会随着数据量的增加而不断优化，数据质量和多样性更关键。”梁家恩告诉我们，“最终还是要回归到框架和数据的优化。”

如果把时间线往前翻，早在2016年，云知声团队就开始建立大规模超算平台Atlas，在这个希腊神话里代表泰坦族擎天神的平台之上，云知声开始了如前文所说的医疗、物联网等产业方向的AI赋能尝试。

“所以，现在单纯堆数据对云知声来说是没有任何难度的，难度在于在一个个具体的产业里能实现落地，可靠并且可用。”梁家恩表示。

三、大模型时代，被释放的「AI力」

如果从更大视角来看云知声选择的路径，会发现一切并非偶然，注重工程优化和产业规模化能力是其突出特点，也更不是一条容易的路。

比如，2016年底层Atlas平台建立时，云知声还仅是一个成立4年的创业公司，“硅谷的专家甚至惊讶，一家成立四年的创业公司考虑这个问题还太早。”

比如，在Atlas平台之上的数据中心模型优化(DCML)层。在2016年云知声开始进入医疗行业后，逐步意识到解决不同医院和科室的数据差异性，是实现规模化应用的关键，就开始构建“统一模型架构+数据迭代调优”的开发模式，即将AI能力能够更为标准化地应用到各个领域，进而实现AI能力的泛“标准化”，就是现在支撑山海大模型训练的DCML平台。

再比如，同样是在2016年，云知声将行业内普遍认为的“靠GPU才能跑起来”的深度学习技术，优化到能在CPU甚至手机芯片上跑起来。同时期，他们甚至把模型做进了主频只有200MHz、计算内存只有200k的WiFi芯片中。

这些在当时看来“不合常理”“超前、费力”的布局，如今都在构成着云知声在这场新的大模型潮水中交出自己答卷的底气。不论是医疗，还是家居，再或者是如今云知声正在深入“教育”等行业，山海大模型都能基于完整的技术支撑实现快速的适配和落地。

梁家恩告诉我们，现在山海大模型在本地部署，企业只需要使用“A10”级别的GPU，就可以达到使用“A100/A800”的推理效果，前者成本仅1万人民币左右，而后两者成本均超过上万美元，本地部署成本降低甚至可以超过80%，后续还可以进一步优化。

在技术支撑之外，基于过往在医疗等行业服务的经验，云知声可以更为迅速地在其它领域进行知识图谱的搭建，配合大模型做到更专业的落地。这是所有AI企业都在实践的路径，当同时兼具大模型和知识图谱能力的团队并不多。

用梁家恩的话来说就是，“如今云知声正在进行第三次技术升级。”如果说2016年，云知声完成的是从“声(感知)”到“知(认知)”的全栈技术体系升级，那么在2022年开始，这家AI企业正在完成的是从“专用AI走向通用AGI”的升级。

不过，今天又和2016年云知声面临的情况不同。

即尽管2016年云知声不论是从底层超算平台，还是上层的数据模型，再或者是基于医疗行业的深入，都在进行创新式的尝试，并验证了企业自身前进的路径。但在当时的时间点，不论是AI能实现的功能和不同行业的复用性，还是人们对AI的认知，都停留在浅层面。

可以理解为，之前AI的生产价值更多的是“专用业务系统+标准AI零部件”的组装模式，业务层的标准化和复用性相当不足，理解能力和灵活性上都有瓶颈；但现在伴随着大模型的出现，可以通过自然语言对接大部分任务，智商显著提升，且能通过大模型调优而非编程方式拓展业务能力，MaaS模式开始成为可能，它正在重新定义AI在企业数字化转型中的位置和作用，更为具体化，也更为有实操性。对AI企业而言，其也对应的是更强大且能够复用的产品技术价值。

换言之，大模型打破了市场对如云知声这样的AI企业设定的业务边界和商业价值的认知壁，重新认识到整合语言、知识、推理、决策等认知能力的大模型，对业务智能化的核心价值和重要意义，它们能做的事情、未来能达到的想象空间，都在有了更新的界定。

而这些的基础，也恰都建立在云知声这样的企业在过往多年的技术坚持和市场探索。在这个AI正在成为社会核心生产力的当下，云知声们正在成为真正的主角。

在山海大模型发布会现场，黄伟有一句话，令人印象深刻，“云知声的过去十年，就是为山海而生。”

写在最后：

云知声的大模型路径可以总结为“产业AI”。即市面上不少大模型的路径是，先进行大模型的底层训练，训练到一定数量级再去寻找能够落地的产业场景和价值。

但云知声的目的和方向都很明确，即初始方向就是在通用大模型的基础上，实现某个专用（产业）的模型能力增强和落地，并且先在医疗和物联等优势产业验证，再拓展不同应用场景分别进行训练尝试，衡量标准是模型是否能在产业内可用、可靠、有价值。

从大模型没有达到终局的现阶段来看，虽然不能论路径的对错与否，但云知声等企业的路径更能让大模型与真实世界产生交集和连接，并且由此一步步转化为真实可见的生产力，不单纯完成TO C的呈现，更实现了在产业侧的“非泡沫”论证，在具体的医疗产业侧，目前其效果和能力更是在超过GPT-4。

这是云知声带来我们的思考，也更是中国AI技术的一次新的自证。

标签：

让群众遇事不烦办事不难

2022-02-15查看详情

河南晒出2021年交通“成绩单”：村村通、户户通农村公

2022-02-15查看详情

芥末味、芽菜臊子味……“怪味”汤圆求上桌，你会相中谁

2022-02-15查看详情

大模型时代，「重识」云知声

大模型时代，「重识」云知声

《中国银行保险报》荣获两奖项-世界热点

【抢抓机遇促发展·青海在行动】天路更通畅 民生更幸福——青藏铁路西格段提质改造工程现场见闻 今日热文

一群大学生用“想象接触”实验反歧视

联想g450ax_联想g450ax

文件转pdf怎么转 文件如何转换成pdf格式_每日快播

香港迪士尼门票多少钱一张人民币（香港迪士尼门票多少钱）

江苏南京：“政务管家”新上线 企业服务再升级 精彩看点

【天天快播报】电脑密码忘记如何解除开机密码_如何在电脑上设置密码

长白山五月人气旺

焦点速讯：张文宏受聘为延安大学附属医院客座教授

西南石油大学成都校区有哪些专业（西南石油大学成都校区）

当前关注：太钢不锈(000825.SZ)2022年度拟每10股派0.25元 6月1日除权除息

无端子外部接线数量如何计算_无端子外部接线是什么意思

世界实时：近期涉面包车超员交通事故已致多人死亡 公安部交管局发布提示

当前时讯：厦门滕王阁物业100％股权挂牌转让，底价410万元

自动驾驶汽车传感器表面积雪预测与评估：基于计算流体力学和拉格朗日粒子法的研究 天天头条

天天速递！宁德时代：致力于船用动力电池系统相关技术、产品研发及应用推广

环球微资讯！委内瑞拉国会议员：美国滥用美元影响力 害人害己

南通海安市委书记于立忠率队赴部分汽车及零部件企业调研

多国持续加强网络环境治理（国际视点）

昆明国资委：“昆明银行口专家路演要点”和《昆明城投专家会议纪要》不实|世界球精选

硅业分会：本周硅料市场价格延续跌势

防火玻璃耐火等级分几个级别_防火玻璃耐火等级

视讯！焊剂需要烘干的目的(助焊剂对预热温度有要求吗)

为什么会有黄褐斑_无非就是这些原因

元气骑士新地图山海经怎么进

多国持续加强网络环境治理（国际视点）

今日精选：腾讯副总裁林松涛任虎牙董事长，押注“内容分发+应用分发”赛道

突围齐本安没有孩子吗 突围齐本安最后离婚了吗？

世界快资讯：【IT之家开箱】iGame GeForce RTX 4060 Ti Ultra W DUO OC 8GB 图赏：精致时尚波普设计，小巧方正超强兼容

“互换通”为金融开放与创新带来哪些新意

小米手机键盘声音怎么关（小米手机键盘声音怎么关闭声音）

实时：三国志战略版太史慈使用攻略（三国志战略版太史慈玩法）

中国华融（02799.HK）：5月23日南向资金增持158.2万股

世界观焦点：sgcc是什么材料_SGCC这几个字母代表是什么材料

世界看点：运动出汗的好处和坏处_运动出汗的好处

纳川股份：公司管材生产基地覆盖福建、天津、江苏、湖北、上海、四川等多个省市_天天视点

感受天府之国独特魅力，“中国有约”国际媒体主题采访活动四川站圆满收官

我的金山银山剧情介绍 我的金山银山剧情介绍结局

世界信息:16岁少女餐厅打工遭猥亵还被嘲讽，色老板遭法官重判

观点：美调查：美国通胀将在今明两年保持高位

环球报道:集装箱市场爆冷！从1.5万降到900，生产公司利润暴跌91%

加强数字人民币业务合作 上海保险交易所与中国银行签署战略合作协议-每日简讯

当前聚焦：云梦县城管局：“练兵提能” 夜学进行时

什么是消费金融 消费金融的含义|天天视点

世界热门:外媒：一厢式货车撞上白宫附近安全护栏，车上搜出纳粹旗帜

足金回收多少钱一克(2023年5月23日） 环球要闻

夏日多伦湖游人渐多|世界播资讯

全球简讯:平安车主卡每月怎么达标_平安车主卡 每月需要满足什么条件才能加油88折

TikTok诉蒙大拿州，欲推翻首个州层面针对其运营的禁令

都是电商，为什么产业电商会比零售电商难做？ 全球观焦点

环球新资讯：2023中国保险公司资金投资收益率情况

民警退休前，握紧他们的手……|报资讯

2023年广西初中级卫生专业技术资格考试成绩查询时间及入口-世界头条

6 月 17 日首映、片长 90 分钟，官方公告小岛秀夫纪录片

环球实时：毅昌科技：5月9日召开业绩说明会，投资者参与

环球热点！【评论】消费者应保护好自身合法权益

世界观点：楚江新材（002171）5月22日主力资金净卖出886.11万元

2024天津公务员考试让应用文写作成为申论考试的得分点 环球观速讯

魔兽世界怎么去火焰之地_怎么去火焰之地

世界实时：华威大学本科申请（华威大学硕士申请条件有哪些）

世界快看点丨美国军工复合体：制造冲突 反噬美国民生

世界观察：娱乐脱口秀 | 我们与戛纳之间的距离

深圳将优化“带押过户”系统，控制交易过程的金融风险

外观内饰新意颇多/动力系统老旧保守 北京现代沐飒600公里长途体验

在珠峰上如何钻取冰芯？科考队员第一视角带你攀上6530米 天天观天下

京东JDG斩获2023 MSI总冠军 持续深化电竞产业链布局|每日消息

世界观察：2023律师属于什么专业 就业前景怎么样

​数字新基建背后的铁塔力量丨江淮大地擘绘数字经济新画卷

玉米煮多久会熟_老玉米要煮多长时间 世界新视野

世界快报:托蒂：如果取决于我 穆帅会留在罗马而不是接手巴黎

乘客“赖”车超30小时遭行拘 司机和平台如何处理？|世界观点

世界快讯:亿缕阳光｜当代年轻人旅游图鉴

上周全市场共计申报28只基金 发行规模有所回暖

世茂集团前4个月累计销售额198.5亿元

全球球精选！韩国济州市农协组合长高凤柱先生一行来天丰农业考察

福建大山的悬崖上发现一天然岩洞，洞中竟建一座寺院，已有870年|世界微资讯

【环球报资讯】组图丨新鲜莲藕尖 正是上市季

【抢抓机遇促发展·青海在行动】天路更通畅民生更幸福——青藏铁路西格段提质改造工程现场见闻今日热文

文件转pdf怎么转文件如何转换成pdf格式_每日快播

江苏南京：“政务管家”新上线企业服务再升级精彩看点

世界实时：近期涉面包车超员交通事故已致多人死亡公安部交管局发布提示

自动驾驶汽车传感器表面积雪预测与评估：基于计算流体力学和拉格朗日粒子法的研究天天头条

环球微资讯！委内瑞拉国会议员：美国滥用美元影响力害人害己

突围齐本安没有孩子吗突围齐本安最后离婚了吗？

我的金山银山剧情介绍我的金山银山剧情介绍结局

加强数字人民币业务合作上海保险交易所与中国银行签署战略合作协议-每日简讯

什么是消费金融消费金融的含义|天天视点

足金回收多少钱一克(2023年5月23日）环球要闻

全球简讯:平安车主卡每月怎么达标_平安车主卡每月需要满足什么条件才能加油88折

都是电商，为什么产业电商会比零售电商难做？全球观焦点

2024天津公务员考试让应用文写作成为申论考试的得分点环球观速讯

世界快看点丨美国军工复合体：制造冲突反噬美国民生

外观内饰新意颇多/动力系统老旧保守北京现代沐飒600公里长途体验

在珠峰上如何钻取冰芯？科考队员第一视角带你攀上6530米天天观天下

京东JDG斩获2023 MSI总冠军持续深化电竞产业链布局|每日消息

世界观察：2023律师属于什么专业就业前景怎么样

数字新基建背后的铁塔力量丨江淮大地擘绘数字经济新画卷

玉米煮多久会熟_老玉米要煮多长时间世界新视野

世界快报:托蒂：如果取决于我穆帅会留在罗马而不是接手巴黎

乘客“赖”车超30小时遭行拘司机和平台如何处理？|世界观点

上周全市场共计申报28只基金发行规模有所回暖

【环球报资讯】组图丨新鲜莲藕尖正是上市季

全球讯息：小投入、高灵活、全合规安超云加速助力县域医共体数字化转型

怎样专套本，短时间拿到自考本科学历？环球快资讯

62个外资项目签约中国—中东欧国家博览会取得多项成果|当前关注

全球观察：陈茂波：香港经济朝高质量发展职专训练发展空间大

媳妇的拼音是轻声吗_媳妇的拼音每日速讯

芯报丨英国将在未来十年内投资10亿英镑，支持国内半导体产业报道

小孩儿瘦腿最快方法_小孩儿怎么最快瘦腿动态

如何保存新鲜玉米草怎么保存新鲜玉米草热门看点

售8.69万起新款捷达VS5/捷达VS7上市-世界视讯

江苏泰州：严守湿地生态保护红线，打造高颜值“水韵江苏”生态经济新高地天天速递

美国白宫发表声明称不会债务违约并计划继续减少联邦政府赤字

浙江海森药业股份有限公司投资者关系活动记录表

旗舰体验入门价格试驾奇瑞艾瑞泽8 1.6T

全球热文：修仙三千年好玩吗修仙三千年玩法简介

宝骏悦也配置曝光提供2款车型/5月25日上市

沙家浜革命历史纪念馆观后感沙家浜革命历史纪念馆|全球看热讯

贵州茅台：1935今年销售目标百亿目前动销情况好于预期

900km超长续航蔚来全新ES6将于5月24日正式发布

纯白机身颜值天花板！魅族20告白礼盒上架：3199元起

欧菲光：5月18日融资买入375.09万元，融资融券余额7.22亿元速看