文本分类任务实践

简单任务:单标签的文本分类任务

语料库一(文本按字分隔):

示例:finance\t如 何 判 断 熊 市 底 部 ?

解释:finance为该句子的标签,\t(tab)为标签和文本的分隔符,“如 何 判 断 熊 市 底 部 ?”为文本。(此文本是以单个字为单位的);

语料库二(文本按词分隔):

示例:finance\t如何 判断 熊市 底部 ?

解释:finance为该句子的标签,\t(tab)为标签和文本的分隔符,“如 何 判 断 熊 市 底 部 ?”为文本。(此文本是以词为单位的);

进阶任务:多标签的文本分类任务

语料库一(文本按字分隔):

示例:world,military\t俄 媒 : 美 越 关 系 亲 近 或 损 害 俄 中 在 东 南 亚 的 利 益

解释:world和military为该句子的标签,\t(tab)为标签和文本的分隔符,“俄 媒 : 美 越 关 系 亲 近 或 损 害 俄 中 在 东 南 亚 的 利 益”为文本。(此文本是以单个字为单位的);

语料库二(文本按词分隔):

示例:world,military\t俄媒 : 美越 关系 亲近 或 损害 俄中 在 东南亚 的 利益

解释:world和military为该句子的标签,\t(tab)为标签和文本的分隔符,“俄媒 : 美越 关系 亲近 或 损害 俄中 在 东南亚 的 利益”为文本。(此文本是以词为单位的);

语料库网盘地址

版权声明:本文为复旦nlp组施展的原创文章,转载请注明出处。