戳戳猫的小窝
更新日志
关于
## 1 基础大模型 处理通用文本生成、理解、对话等任务,是大多数AI应用的底层核心。 如GPT-3.5,GPT-4、Deepseek-V3 ## 2 多模态大模型 能同时处理文本、图像、音频等多种输入或输出形式,实现跨模态交互。 如GPT-4o ## 3 推理大模型 这些模型专注于深度推理和逻辑分析,擅长处理需要复杂推理和深度思考的问题,如数理逻辑推理、编程代码分析等。DeepSeek-R1模型有660B的参数,并采用了后训练+RL强化学习方法,能够从多个角度分析问题,并给出经过严密推理后的解答。 如GPT-o1、GPT-o1mini、o3-mini、Deepseek-R1 ## 4 编程大模型 编程大模型在代码生成、代码补全、代码审核等方面具有重要作用,能够帮助程序员提高开发效率和代码质量。 如qwen2.5-coder、deepseek-coder ## 5 视觉大模型 用于处理图像或视频内容的理解。 如Qwen2.5-VL ## 6 文生图大模型 根据文本描述生成高质量图像或艺术创作。 如DALL·E、stable diffusion ## 7 文生视频大模型 文生视频模型,可根据文本生成高清视频,支持扩展或补全现有视频帧。 如Sora ## 8 语音合成大模型 将文本转换为自然流畅的语音,支持多语种和情感化表达。 如TTS ## 9 语音识别大模型 将语音或音频内容转写为文本,支持多语言和方言。 如Whisper ## 10 文本嵌入模型 将文本转化为高维向量,用于语义搜索、聚类、推荐系统等。 text-embedding-3-large text-embedding-3-small text-embedding-ada-002 ## 11 审查大模型 自动检测文本或多媒体内容中的违规信息(如暴力、偏见、敏感话题)。 omni-moderation-latest text-moderation-latest
5.大模型的分类