开放资源

OceanGPT秉持开源开放的原则,开放指令数据集、开源模型促进海洋大模型研究。

开源大模型

OceanGPT-o-7B

OceanGPT-o-7B-v0.1基于Qwen2.5-VL-7B-Instruct ,在海洋领域的双语语料上进行了训练。

OceanGPT-coder-7B

OceanGPT-coder-7B-v0.1基于Qwen2.5-Coder-7B-Instruct,在海洋领域的自有双语代码语料上进行了训练。

Oceangpt-basic-v0.3

OceanGPT-basic-v0.3基于Qwen,在知识增强的海洋领域双语语料上进行了训练。待发布。

Oceangpt-basic-14B-v0.1

Oceangpt-basic-14B-v0.1基于Qwen1.5-14B,在海洋领域语料上进行了训练。注意:本模型属于早期版本,效果已不如最新模型。

Oceangpt-basic-7B-v0.2

Oceangpt-basic-7B-v0.2基于Qwen2,在海洋领域语料上进行了训练。注意:本模型属于早期版本,效果已不如最新模型。

Oceangpt-basic-2B-v0.1

Oceangpt-basic-2B-v0.1基于MiniCPM-2B,在海洋领域语料上进行了训练。注意:本模型属于早期版本,效果已不如最新模型。

开源指令数据

OceanInstruct-v0.2

基于公开语料构建的约50K中英双语海洋领域文本指令数据。

OceanInstruct-o

基于公开语料构建的约50K中英双语海洋领域多模态指令数据。

OceanInstruct-v0.1

基于公开语料构建的约10K中英双语海洋领域文本指令数据。注意:该指令数据仅为早期模型使用的部分数据。

局限性

1. 该模型可能存在幻觉问题,请您仔细甄别。
2. 因计算资源有限,OceanGPT-o目前只支持部分类型声呐图和海洋科学图片的自然语言解读生成,OceanGPT-coder目前只支持MOOS代码生成。
3. 我们尚未对模型的身份进行优化,因此其生成的身份信息可能与 Qwen、MiniCPM、LLaMA 或 GPT 系列模型相似。
4. 模型的输出受到提示词的影响,可能导致多次生成结果不一致。
5. 部分指令数据为大模型合成数据,可能存在错误。

ZH_CN