2018年3月25日日曜日

インド語へのPyiwn

インド語についてYouTubeで文字について興味があったので見てから、今度はWordNetが利用できないか調べてみたら、IndoWordNetの存在を知りましたが、アクセスするとゲートウェイエラーが発生してしまいます。

そこで役立つのがPyiwnです。

これでアクセスすれば、インド語ワードネットへアクセスできます。
そこで早速試してみましたが、ちゃんとアクセスできるようになりました。
インストールも簡単で、

pip install pyiwn

これだけです。ヒンディ語を試すとアクセスできます。
from pyiwn import pyiwn
pyiwn.download()
iwn = pyiwn.IndoWordNet('hindi')

これからインド語への調査で役立つツールになります。
Synset:531
Word:11万
と単語数も十分な数があります。これでヒンディ語の解析も可能な時代になりました。

この他試した言語はいかのようでした。
lng=['assamese',
# 'bangla',
'bodo',
'gujarati',
'hindi',
'kannada',
'kashmiri',
'konkani',
'malayalam',
'meitei',
# 'mrathi',
'nepali',
# 'odia',
'punjabi',
'sanskrit',
'tamil',
'telugu',
'urdu']
for l in lng:
  print(l)
  iwn = pyiwn.IndoWordNet(l)
それにしても1国でこれだけ言語があるので、インドの人が数学でも言語の分野でも苦労が多いことでしょう。

苦労することは知識や知能が発達する可能性が高いと考えられます。

0 件のコメント:

コメントを投稿