Closed
27

英語データセット・APIとか

  • index -> alphabetized list of all the words アルファベット順
  • data -> A data file for a syntactic category contains information corresponding 単語のまとまり・関係性みたいなこと?offsetに対応してると考えて良いのか?
  • index.offset -> synset_offset Byte offset in data.pos

en-dictionay

  • 1系だとデータが上書きされてverbしか取れないバグがある
  • 2系はまだ非公開で、githubから取ってきてTSでグリグリするしかない

wordnet系


こんな構造になってそう(点線は存在しないが実質存在するもの)


lexicalEntryからsense / synsetの繋がりにクセがある

  • en-word.netのDerriver Fromとは?
    • おそらくderivationのrelationの逆引きを含めたものっぽい
    • delivationで循環がカバーされているものとされてないものがあるっぽい
このスクラップは2日前にクローズされました
ログインするとコメントできます