戳戳猫的小窝
更新日志
关于
## 1 国外 ### 2.1 GPT - **GPT-3**:由OpenAI开发的大型语言模型,具有1750亿参数。它在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。 - **GPT-4**:OpenAI推出的更先进的模型,相比GPT-3,它在参数规模、训练数据量和模型架构上都有显著提升,能够更好地理解和生成自然语言文本,处理更复杂的任务,如长篇幅文本生成、多轮对话等。 - **GPT-4o**:GPT-4的多模态版本,支持文本、音频和图像的任意组合输入,并能生成文本、音频和图像的任意组合输出。它在视觉和音频理解方面表现出色,能够处理复杂的多模态任务,如图像描述生成、视频内容理解等。 ### 2.2 BERT 由Google开发的预训练语言模型,主要用于理解自然语言文本。BERT通过遮蔽语言模型(Masked Language Model, MLM)和下一句预测(Next Sentence Prediction, NSP)任务进行预训练,能够生成高质量的文本表示,适用于各种下游任务,如文本分类、问答系统等 ### 2.3 Claude 由Anthropic开发的大型语言模型,具有与GPT系列类似的架构和功能。Claude在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。 ### 2.4 LLaMA(开源) 由Meta开发的大型语言模型,具有70亿到650亿参数。LLaMA在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。LLaMA的训练数据包括大量的网页文本和书籍,使其具有广泛的知识覆盖。 ## 2 国内 ### 2.1 文心一言 由百度开发的大型语言模型,具有千亿级参数。文心一言在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。文心一言还支持多模态输入,能够处理图像和文本的结合任务。   ### 2.2 通义千问(部分开源) 由阿里巴巴开发的大型语言模型,具有千亿级参数。通义千问在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。通义千问还支持多模态输入,能够处理图像和文本的结合任务。 ### 2.3 讯飞星火 由科大讯飞开发的大型语言模型,具有千亿级参数。讯飞星火在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。讯飞星火还支持多模态输入,能够处理图像和文本的结合任务。 ### 2.4 字节豆包 由字节跳动开发的大型语言模型,具有千亿级参数。字节豆包在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。字节豆包还支持多模态输入,能够处理图像和文本的结合任务。 ### 2.5 Kimi 由月之暗面科技开发的大型语言模型,具有千亿级参数。Kimi在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。Kimi还支持多模态输入,能够处理图像和文本的结合任务。 ### 2.6 Deepseek(开源) 由DeepSeek开发的大型语言模型,具有千亿级参数。DeepSeek在自然语言处理方面表现出色,能够进行文本生成、问答、翻译等多种任务,生成的文本具有较高的连贯性和逻辑性。DeepSeek还支持多模态输入,能够处理图像和文本的结合任务。
6.国内外大模型