首页必威体育betway › 极仍机场 Conditional Random Fields

极仍机场 Conditional Random Fields

简介

假若你有冠西哥相同上在遭之照(这些照片是遵循时间清除好序的),然后你怪低俗之怀想让每张照片由标签(Tag),比如就张凡冠西哥于偏,那张是冠西哥在睡觉,那么您该怎么开呢?

一律种植方式是无论这些照片的序列性(照片当然是遵循时间排序的),然后于各级张图纸做一个分类器。例如,给了而冠西哥一个月份之在仍当训练样本(打了Tag的),你恐怕就是见面念及:早上6点不明的像或者就是是冠西哥于上床;有诸多亮色的肖像或者就是冠西哥当跳舞;有为数不少车的照或就是冠西哥当飙车。

深肯定,照片的序列性包含有多音讯,忽视她是无对滴。比如,你看看了同样布置大嘴的特写,这个时段冠西哥是于就餐吗还是以唱歌?如果您懂冠西哥当前边一个时间点的照片上是于煮饭,那么大有或这张就是当偏了;如果面前一个时间点的影上外是以歌唱或者跳舞,那么这张就老有或是于唱。

故而呢,我们理应运用nearby照片的音信来增长我们标签机(暂时这么叫吧)的准确性,这正是条件仍机场所涉的从。


词性标注

脚用词性标注的例子来阐释一些细节。

词性标注:给您一个句(a sequence of words or
tokens),然后你叫每个单词标注它是动词、副词还是形容词,或者其他。

纵使如其它的分类器一样,我们用定义有特征函数(feature functions) f i  


极仍机场里之特征函数

以条件仍机场中,每个特征函数有脚几乎单输入值:

  • 一个句子 s
  • 一个单词在句子中之岗位 i
  • 目前单词的标签l i  
  • 前面一个单词的标签l i−1  

输出为一个实数(虽然一般就是0或者1)

(注释:实际上,在此地我们把特色限制在了手上单词和前边一个单词的竹签达成,而未是普句子中之妄动标签,我们在此刻构建了一个原则仍机场的特例——linear
chain CRF。为了简洁性,我们这边就谈谈这种特例)

随,一个恐怕的特征函数:度量前一个单词是"very"的下,当前单词被标为形容词的可能。


特性转化为概率

连通下去我们受每一个特征函数f j  
授予一个权值λ j  
(在底下我会交代怎么上这些权值)。现在加一个句子s,我们就是会计算一个一定的竹签集l 
的加权得分了(l 
大凡a sequence of labels,如(NOUN, ABJECTIVE...)
表示给s的率先单单词标为NOUN,第二只单词标为ABJECTIVE):

score(l|s)=∑ m j=1 ∑ n i=1 λ j f j (s,i,l i ,l i−1 ) 

(外层的伸手与是本着负有的feature
function求和,内层的要与是指向句中的有所单词求和)

末了,我们拿这些得分(score)正则化到0-1:

Missing open brace for
superscript 


有特征函数的例子

  • 如果l i  
    是副词并且第i独单词以"ly"结尾,则f 1 (s,i,l i ,l i−1 )=1 
    ,否则为0

    • 只要我们为这个特征函数赋大且刚刚之权重,那么就是我们格外乐意将为"ly"结尾的单词看成是副词。(因为权要,最后对总score的奉献大嘛)
  • 如果i=1 
    并且l i  
    是动词必威体育betway,并且句子以"?"结尾,则f 2 (s,i,l i ,l i−1 )=1 
    ,否则为0

    • 相同的,如果我们深受此特征函数赋大且刚刚的权重,说明我们充分情愿用因"?"结尾的句子的率先个才词标为动词。
  • 如果l i−1  
    举凡形容词并且l i  
    是名词,则f 1 (s,i,l i ,l i−1 )=1 
    ,否则为0

    • 平的,大且正之权重,说明我们愿意以形容词后面的词标为名词(或者将名词前面的词标为形容词)
  • 如果l i−1  
    是介词并且l i  
    也是介词,则f 1 (s,i,l i ,l i−1 )=1 
    ,否则为0

    • 夫就是反着的了,英语中好像木有些许单介词连用的景况,所以这个时候我们的权重得是凭的,说明我们无希罕这种搭配。

今天而该知情了咔嚓,总结一下:为了打一个规范仍机场,你唯有需要定义有特征函数(它们凭借让漫天句子,当前之职务,附近的签),然后以这些函数加权求和,再正则化就得抱最终的票房价值了。

转载本站文章请注明出处:bway883.com https://www.piworx.com/?p=642

上一篇:

下一篇:

相关文章

网站地图xml地图