所有大模型都是“预制菜”吗 大厂厨房出品更香
所有大模型都是“预制菜”吗 大厂厨房出品更香!预制菜成为热门话题。作为食客,大多数人可能不喜欢预制菜。但对AI从业者来说,“大模型预制菜”更为吸引人,现炒的大模型反而不太靠谱。
如果要“现炒”大模型,会遇到很多问题。比如,需要搭建合适的计算环境,小规模的计算资源无法满足需求,而大规模的集群则需要很长时间来构建,并且维护起来也十分复杂。此外,优质的GPU等硬件资源非常稀缺,国产设备可能无法提供足够的算力。大模型通常涉及千亿甚至万亿参数,小规模计算资源只能进行推理,无法完成训练任务。业界通常使用几万个计算节点同时运行数月才能完成一个大模型的训练。
高质量的数据是另一个关键因素。数据预处理工作量巨大,而且需要大量的高质量数据。即使有了足够的计算资源和数据,还需要掌握相应的技术知识来进行模型训练、微调或推理。否则,可能会导致训练失败,结果不尽如人意。
许多企业客户在没有明确业务需求的情况下盲目投入大量资金建设大模型,最终发现这些模型并不符合实际需求,造成了浪费。所有大模型都是“预制菜”吗 大厂厨房出品更香 所有大模型都是“预制菜”吗 大厂厨房出品更香