第四范式发布先知AIOS 5.0,Predict the Next “X”
2024-03-29

今天,第四范式发布了先知AIOS 5.0,一款全新的行业大模型平台。

大语言模型的原理是根据历史单词去不断预测下一个单词,换一句常见的话:Predict the Next “Word”。

当前对于行业大模型的普遍认知就是沿用这种逻辑,用大语言模型去 fine-tune 行业数据,预测下一个字。

但各行各业的场景往往面对的不是简单的文字格式,行业需要的往往也不是预测下一个字,而是Predict the Next“X”,这里的“X”可能包含水文数据、健康报告、设备监测数值、设计推演等。

先知AIOS 5.0 进一步升级预测下一个X的能力。其核心特点是基于各行各业场景的X模态数据,构建行业基座大模型。



先知AIOS 平台是第四范式的核心产品,时至今日已经发展近10年, 通过先知AI平台1.0到5.0的进化,持续降低AI门槛,实现对更多场景的规模化覆盖。2015年,先知AIOS 1.0版本首次发布,通过高维、实时、自学习框架大幅提升模型精度;2017年,先知AIOS 2.0版本利用自动建模工具HyperCycle,大幅降低了模型开发门槛;2020年发布的先知AIOS 3.0版本规范AI数据治理和上线投产,完成建模到落地应用“最后一公里”;2022年,先知AIOS 4.0版本引入北极星指标,最大化发挥AI应用价值,提升企业核心竞争力。今天发布的先知AIOS 5.0版本,旨在帮助各行各业构建行业基座大模型。

全新升级后的先知AIOS 5.0,解决了当前行业大模型只能将行业文本数据喂给大语言模型、生成下一个字的问题,让大模型能来到的领域更加广泛。以健康管理领域为例,如果把大量的专业医学及健康相关的语料投喂给大语言模型,大语言模型可以理解相关的术语和指标;但如果你把自己近三年的体检报告中的某些指标发给大模型,并询问明年自己的身体状况,它并不能够预测给出答案,因为这个问题超出了“语言“的范畴。所以这样的行业大模型并不是一个真正的健康管理大模型。

如何才能构建真正的健康管理大模型呢?如果“X“的模态从“文字Word”变成了“体检报告数据”,模型如果可以不断地根据历史体检报告数据去预测下一个体检报告。这就是AIOS 5.0平台上构建的一个健康管理大模型。

使用Predict the Next “X”的技术原理,第四范式已经与客户一起打造了一系列的行业大模型。



例如在健康管理领域,X是体检报告数据,我们基于历史上的体检报告数据,构建了健康管理大模型。它会基于过去5年你的体检报告,依次“生成”未来第1年、第2年、第3年的体检报告,供医生给出专业的健康管理建议。




又例如在水电管理领域,X是设备检测数据,我们基于历史上的设备检测数据,构建了水电设备大模型。它会基于过去7天机组子部件的运行状态,依次“生成”未来 3 天小时级的定转子部件报告,供运维人员给出维修方案。





在水务领域,X是水文数据,我们基于历史上的水文数据,构建了水务大模型。它会基于历史水文数据和未来7天的气象数据,依次“生成”未来第1天、第2天……至第7天的水文数据报告,供水文监测人员识别发生洪水及相关次生灾害险情、采取应急预案。





在声学领域,X是射线分布图,我们基于这些历史数据,构建了声学大模型。它可以基于音乐厅的几何模型和房间数据,从声源发射5000Hz频率射线,生成射线在10ms,20ms,30ms,40ms的位置分布图。供专业人员评估当前音源摆放位置是否给观众提供高品质的听觉体验。





以上的行业大模型都是基于先知AIOS 5.0构建的。企业用户可以基于“X模态”的数据,在该平台上构建行业大模型,解决行业的高价值问题。