钛媒体App 3月2日讯,复旦大学自然语言处理实验室(FudanNLP)的最新研发成果——多模态大模型“复旦·眸思”(MouSi)正式亮相。该模型驱动的“听见世界”APP现已上线,旨在为视障者提供生活助手与智能管家的功能。这一创新技术的诞生,标志着人工智能在辅助视觉障碍领域迈出了重要一步。
据悉,复旦大学自然语言处理实验室在2023年上半年发布了名为MOSS的对话式大型语言模型,被誉为中国的GPT。而“眸思”作为多模态模型,与基于文本的MOSS不同,它具备理解和识别图片内容的能力,旨在成为视障者的“眼睛”。
该实验室师生经过不懈努力,成功将“眸思”应用于“听见世界”APP中,让视障者能够通过语音交互,了解周围环境的图像信息,从而在日常生活中获得更多便利。这款APP不仅提供了生活助手的功能,还充当了智能管家的角色,帮助视障者更好地管理日常生活。
“眸思”的研发成功,不仅展示了复旦大学在人工智能领域的领先实力,也为视障者带来了全新的生活体验。未来,随着技术的不断进步和完善,相信人工智能将在辅助视觉障碍领域发挥更大的作用,让更多人感受到科技带来的温暖与关怀。