四川长虹电器股份有限公司 访客留言 申请认证

信用网址: 10484425.11315.com   

其他股份有限公司(上市) 成立历史第32 

一种电视问答语料数据的增强方法【异议或纠错】

档案编号: CQ-133-7170-9315
档案文号:
专利权人: 申请人 
发布时间: 发布时间 
档案分类: 专利权 
分 类 号: 第G06F40/30;G06F40/289;G06F40/58;G06F40/247;G06F40/211;G06F18/22类
授权状态: 已授权
档案内容: 本发明主要涉及自然语音处理领域。为了解决电视问答模型中由于可用于进行模型训练的有效数据不足,导致模型训练结果准确度不够的问题,本发明提供一种电视问答语料数据的增强方法,通过收集电视问题语料数据,自定义构建分词字典;对收集的问答语料数据进行纠错后分别输入EDA模块与回译模块,获得n条增强文本;用自定义的分词字典对纠错后的原始语料数据和增强文本进行分词处理后输入文本生成模型,获得二次增强文本;将二次增强文本输入encoder模型,获取词向量,输出增强文本结果,能够有效地有效提高模型泛化能力,增强用户体验。
附件下载:  (原始资料备查)

相关专利信息信息

评论

您需要登录后才可以发表评论,请 登录注册

打分

说明:
一、所有信息力求客观、真实:以上信息由全国各级政府职能部门、各行业协会(社团组织)、金融机构、主流媒体、信息主体或实名制下的广大消费者(包括交易对方、员工等)客观提供,不含有本征信平台的任何主观评价;
二、信息异议机制:欢迎大家对有异议的信息及时提出,我们将按照《绿盾全国企业征信管理办法》规定对异议进行核实、修正,确保客观、公平;
三、尊重发布者权益,永不"删贴":对于符合国家法律、法规和本征信平台规定的每一条信息,都将客观记录于企业信用档案,参与信用分值计算,并长期保存。

分享到:
绿盾在线
×
=合作留言=
绿盾业务合作
×
  • 马先生
    15652211315
  • 黄先生
    15652011315