小型语言模型(SLM)即小语言模型,是专为高效处理语言任务而设计的神经网络,一般被视为参数少于100亿个的语言模型。小语言模型在设计上与大语言模型(LLM)核心理念相似,但模型的参数数量、整体规模较大语言模型更小。
GPT-4、Gemini等大语言模型具有优异的数据处理能力、更高的计算强度,但大语言模型对计算资源的要求较高,需要大量存储空间,在实际中常用于云服务、数据中心、高性能计算系统等资源丰富的环境。
根据新思界产业研究中心发布的《
2025-2030年小型语言模型(SLM)行业市场深度调研及投资前景预测分析报告》显示,相比大语言模型,小语言模型具有易部署、硬件要求低、高效灵活、成本低、能源消耗少等特点,更适用于计算资源有限的应用程序。小语言模型更胜任简单的文档索引、数据搜索等任务,目前已在台式机、智能手机、智能可穿戴设备、边缘设备等现代智能设备中已得到广泛应用。
小语言模型是AI领域发展新热点,科技巨头正竞相布局。目前谷歌、微软、OpenAI、英伟达、Anthropic、Meta、Apple、阿里巴巴、vivo等企业均已布局小语言模型研发。以OpenAI公司为例,OpenAI公司提供了GPT-4o、GPT-4o mini等小语言模型,其中GPT-4o mini是OpenAI最智能、最实惠的小模型,在MMLU(文本智能和推理基准测试)中得分为82.0%。
《麻省理工科技评论》是全球最具影响力科技智库之一,其自2001年开始评选“十大突破性技术”,在2025年“十大突破性技术”中,小语言模型入选其中,进一步体现出了小语言模型在人工智能领域的重要性和影响力。
小语言模型可以通过引入模型压缩、高效架构、知识蒸馏、最大更新参数化、二阶段预训练等策略提升其性能。小语言模型具有独特优点,但同时也伴随一定局限性,如受参数量限制,小语言模型处理能力较差,在复杂的自然语言处理(NLP)领域难以达到大语言模型性能水平;由于引入模型压缩、知识蒸馏等策略,小语言模型开发复杂性增加。
新思界
行业分析人士表示,小语言模型具有高效灵活、易于部署、成本低、能源消耗少等优势,在部分特定领域,其已成为大语言模型的有效替代方案。作为AI领域发展新热点,近年来,全球范围内小语言模型成果不断涌现,在相关企业推动下,小语言模型在智能家居、医疗保健、零售、办公等场景逐渐实现商业化落地,产业发展已进入成熟期。