深绎未来申请多语言大模型训练专利
专利摘要显示,本发明公开了一种多语言大模型训练方法、装置及相关设备,所述方法包括:获取平行语料数据,并基于子任务类型对其进行格式转换,得到与多个子任务类型对应的数据格式;将平行语料数据和数据格式输入初始多语言大模型,该模型包括子网络层,子网络层与子任务类型一一对应;计算每个子网络层的损失τ;根据每个子网络层的损失τ,计算全局损失L;利用该L对模型进行更新,得到更新后的多语言大模型。采用本发明可以提高平行语料数据的利用效率,并在不影响多语言大模型的能力的基础上提高其对低资源语种的理解能力。

多语言大模型训练方法详解
本实施例中,通过获取长文本训练数据以及增大旋转位置编码的旋转角底数,对预训练的大语言模型进行训练,实现输入文本序列的长度扩增,使训练完...
专利申请信息
金融界2025年1月31日消息,国家知识产权局信息显示,中国电建集团西北勘测设计研究院有限公司申请一项名为“基于元学习的大语言模型训练方法、...
根据专利摘要,这项新技术涉及大语言模型的推理运算,构建了一个集内存模块、计算模块与控制模块为一体的系统。近日,从金融界传来一条重磅消息——中昊芯英科技有限公司申请了一项名为‘一种推理装置、方法、介质及芯片’的专利,旨在显著提高内存模块和计算模块的利用效率。在科技日新月异的今天,关于人工智能和大语言模型的研究依旧是热点话题。
深绎未来引领行业发展
金融界2024年10月9日消息,国家知识产权局信息显示,未来基因人工智能研究院有限公司申请一项名为“基于知识图谱和大语言模型的问答方法...
公司简介
天眼查资料显示,深绎未来科技有限公司,成立于2024年,位于珠海市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本100万人民币。通过天眼查大数据分析,深绎未来科技有限公司共对外投资了1家企业,专利信息2条,此外企业还拥有行政许可2个。
专利技术亮点
专利摘要显示,本申请公开了一种大模型的训练方法、任务处理方法、设备、介质及程序产品,其中训练方法包括:在任一训练轮次中,调用待训练模型...
人工智能行业发展趋势
国家知识产权局 发明专利申请 申请公布号 CN 117709355 A 申请公布日 2024.03.15 申请号 202410164274.8 G06F 40/216 申请日 2024.02.05 申请人 四川蜀天信息技术有限公司 地址 625000 四川省....该方法包括:获取初始语料文本集合;其中,初始语料文本集合中包括多篇语料文本,每篇语料文本对应一个标签信息集合;对初始语料文本集合中的所有语料文本进行预...
用户体验与内容价值并重
汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用。同时,这一数据集的建立对于推动中文信息处理技术的发展也有着不可忽视的作用,它能够帮助算法更好地理解汉语,提升机器翻译、语音识别等技术的准确度和效率。这些预处理步骤使得语料库更适合进行词频统计、情感分析、主题建模、机器翻译、文本分类、命名实体识别、信息抽取等多种自然语言处理任务...
未来展望
金融界2025年3月26日消息,国家知识产权局信息显示,深绎未来科技有限公司申请一项名为“一种多语言大模型训练方法、装置及相关设备”的专利,公开号 CN 119670847 A,申请日期为2024年11月。
行业挑战与解决方案
特权邮箱,付费)免费下载网易官方手机邮箱应用中国大学视频公开课国际名校公开课赏课·纪录片付费精品课程北京大学公开课英语课程学习新人特...
在上周举行的向星力·未来数据技术峰会上,上海大数据基础软件龙头企业星环科技推出多个行业大模型以及大模型训练工具,为企业定制符合自身业务需求的专属大模型提供又一选择。.总体来说,星环Sophon LLMOps有助于解决客户的3个核心痛点:第一,提供一站式工具链,帮助客户从 通用大语言模型 训练/微调,得到 满足自身业务特点的领域大语言模型 ;第二,帮助客户将原型的...
欢迎分享你的经验
未来,随着技术的进步,电商与自媒体将更加注重用户体验与内容创新,从业者可以通过实际体验来验证这一趋势。欢迎大家在评论区分享你的经验,看看是否与我们的预测一致。
欢迎分享,转载请注明来源:小川电商