大模型“全家桶”开源打头阵。发布会上,九章云极DataCanvas自主研发的DataCanvas Alaya 九章元识大模型矩阵开源了“Alaya-7B大模型系列”中的两大模型,分别为Alaya-7B Foundation Model通识大模型和Alaya-7B Chat Model对话大模型。
九章云极DataCanvas 公司副总裁于建岗博士介绍,Alaya-7B大模型系列在保证模型表现的同时,对使用者的安装使用硬件要求更低、应用技术难度更低、训练所需的算力资源消耗更小,有助于加速大模型在各类行业场景的实际应用。
一并开源的还有“LLMOps大模型工具链”中的LMS模型运行工具和LMPM提示词管理器两大工具。前者能够提高大模型的交付速度和质量,降低大模型的运维和运营成本,以及完成大模型生产化及服务运营等方面的需求;后者则通过帮助用户设计更好的提示词,引导大模型生成更加准确、可靠、符合预期的输出内容。
此外,九章云极DataCanvas还发布了公测的TableAgent数据分析智能体。据了解,在充分理解用户意图后,TableAgent能够自主地利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。
值得一提的是,Code Interpreter(代码解释器)对国内众多企业用户的最大障碍是企业数据因为安全性、合规等种种原因,不能传输到线上的共有服务平台。
而TableAgent为企业提供私有化部署,系统部署在企业内部,数据不外流,从根本上解决了安全合规的问题,同时TableAgent也可以满足企业级数据的大规模、高性能分析的要求,这也是Code Interpreter目前的短板。
从底层架构到一众工具的配合,最终的目标指向的都是落地。“包括算力限制等原因在内,大模型出现以后,目前为止在企业里面有一定的难度真正的落地和应用”,在接受北京商报记者采访时,于建岗如此说道。
他还补充称,当下企业在使用的大部分的开源大模型,通常是企业下载一个训练好的大模型自己进行微调,或者拿着商用版的大模型找企业进行商业化开发,但这种方式是存在短板的。而九章云极DataCanvas提供的就是这样一整套落地方案,Alaya是智算中心的核心,再搭配上算力、工具等,帮助企业更好地应用大模型。
发布会上,九章云极DataCanvas也与人工智能产业链上下游合作伙伴签订战略合作,提速AI软硬件自主创新、工业领域AI技术规模化应用和国产化智能算力建设。
ChatGPT推出一年,大模型的风也刮了一年,经历过初期的狂热后,落地逐渐成为行业的共识。但就目前的发展情况而言,大模型的落地显然不是一蹴而就的,单有模型不行,单有算力也不行。
不久前,中国工程院院士、清华大学计算机系教授郑纬民还在公开场合提到,要大力开展基于国产AI芯片大模型基础设施研究,完善国内AI生态系统建设,做好整体系统工程化,关注软硬件协同设计,解决大模型基础设施建设的关键问题。
大模型落地,越来越需要一个“生态圈”,在这个生态中,硬件算力提供基本的资源基础,软件的高效协同则发力灵活性和效率的提升。
就像郑纬民说的,国内AI生态尚未建设完善,“大多数任务不会因为国产芯片性能只能达到国外芯片性能的60%而有明显感知,大家感觉到的不好用还是生态不行。即使硬件做得比国外更好,但如果生态没有做好,依然不会被喜欢”。
不过于建岗乐观地判断,明年应该是中国大模型商业化的元年,“可能会有一些商业化进程中比较被大家看好的‘苗子’出现”。IDC近日公布的一组数据显示,在中国基于大模型的AI市场规模在6亿美元,到2027年这一数字将增长至96亿美元。
北京商报记者 杨月涵