标签识别下的文章 - 科学空间|Scientific Spaces

6 Sep

基于双向LSTM和迁移学习的seq2seq核心实体识别

By 苏剑林 | 2016-09-06 | 143662位读者 | 引用

暑假期间做了一下百度和西安交大联合举办的核心实体识别竞赛，最终的结果还不错，遂记录一下。模型的效果不是最好的，但是胜在“端到端”，迁移性强，估计对大家会有一定的参考价值。

比赛的主题是“核心实体识别”，其实有两个任务：核心识别 + 实体识别。这两个任务虽然有关联，但在传统自然语言处理程序中，一般是将它们分开处理的，而这次需要将两个任务联合在一起。如果只看“核心识别”，那就是传统的关键词抽取任务了，不同的是，传统的纯粹基于统计的思路（如TF-IDF抽取）是行不通的，因为单句中的核心实体可能就只出现一次，这时候统计估计是不可靠的，最好能够从语义的角度来理解。我一开始就是从“核心识别”入手，使用的方法类似QA系统：

1、将句子分词，然后用Word2Vec训练词向量；
2、用卷积神经网络（在这种抽取式问题上，CNN效果往往比RNN要好）卷积一下，得到一个与词向量维度一样的输出；
3、损失函数就是输出向量跟训练样本的核心词向量的cos值。

点击阅读全文...

分类：信息时代标签：python, 自然语言处理, 识别, NER 阅读全文 46 评论

关于站长

苏剑林|BoJone，科学空间博主，【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者（但不专业）......目前31岁，还在单调递增。希望能一直在此分享科学之美～

你也许会关心：

科学空间|Scientific Spaces 介绍

科学空间QQ交流群：67729435

科学空间微信交流群：spaces_ac_cn

常见问题集：《科学空间FAQ》

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

热门标签

随机文章

最近评论

Linz: 感谢您的分享，您的想法和推导非常有意思！我们也发现了比较相关的性质，整理到了之前的文章（Lin...
JimmySue: 苏神，信噪比章节的对比方式感觉不严谨。高斯分布样本的均值的分布方差是原来的 1/n, 均值 p...
tsotfsk: AUC的光滑近似就是pairwise的loss。《MBA: Mini-Batch AUC O...
王磊: 如果把模型架构和训练方式分开考虑的话，rectified flow是一种特定的训练contin...
777: 是推理的时候多步去噪后的结果近乎噪声，预测x0正常也指的是多步去噪后的最终结果，用的是1d的unet
stan: 苏神好，请问有办法对2D的embedding加上一些额外性质吗？比如让它轴对称
rukawa: 苏神有个问题请教一下，在计算梯度的推到中，说了这么一句话“为了更利于优化，我们应该选取\alp...
Peacer68: 想请教一下苏神，这里预测$x_0$和预测$v_t$有什么本质上的区别吗？我个人理解是无区别，因...
Cheng: 苏神好，我最近在模型里加了二维的rope，但是没找到相关的开源实现，不知道是不是我理解的这样，...
苏剑林: 握手。