复旦大学研发AI大模型助力视障者“看见”世界

钛媒体App 3月2日讯，复旦大学自然语言处理实验室(FudanNLP)的最新研发成果——多模态大模型“复旦·眸思”(MouSi)正式亮相。该模型驱动的“听见世界”APP现已上线，旨在为视障者提供生活助手与智能管家的功能。这一创新技术的诞生，标志着人工智能在辅助视觉障碍领域迈出了重要一步。

据悉，复旦大学自然语言处理实验室在2023年上半年发布了名为MOSS的对话式大型语言模型，被誉为中国的GPT。而“眸思”作为多模态模型，与基于文本的MOSS不同，它具备理解和识别图片内容的能力，旨在成为视障者的“眼睛”。

该实验室师生经过不懈努力，成功将“眸思”应用于“听见世界”APP中，让视障者能够通过语音交互，了解周围环境的图像信息，从而在日常生活中获得更多便利。这款APP不仅提供了生活助手的功能，还充当了智能管家的角色，帮助视障者更好地管理日常生活。

“眸思”的研发成功，不仅展示了复旦大学在人工智能领域的领先实力，也为视障者带来了全新的生活体验。未来，随着技术的不断进步和完善，相信人工智能将在辅助视觉障碍领域发挥更大的作用，让更多人感受到科技带来的温暖与关怀。

大众创投网