Group Description
【概要】
ソースコード(人工言語)へのシンタクスハイライトの恩恵は計り知れません。
では自然言語に適用したらどうなるか?
その可能性を模索するもくもく読書会です。
「読書中」に「インタラクティブ」に「動的」にハイライトします。
読書前に自動で静的にびっしりハイライトするのは目がチカチカして逆効果です。
自然言語へのハイライトはおそらく検討されていて、実際に特定業界(知財・特許)では多用されています。
上記業界の文章は難しいです。一般文書でも同様に難しい文章に有効な技術と見てます。
(難しいほど有効だったりします)
しかし一般的になっていないのは上の動的観点が抜けているからとみています(※)。
またキーワードをハイライトする以外にも視認性を向上する術はあるはずです。
一例として構文解析を利用したハイライトも用意してたりします。
新しい読書法を体験してみませんか?
※ 特許業界ではその特有な使い方(ここでは割愛します)ゆえに、インタラクティブなハイライト抜きでも成功しています。
【自然言語へのハイライト(例)】
単語タップによるアドホックな多色ハイライト
詳しい話はこちら
【やりたいことリスト】
1.新しい読書法を使った読書会
上記参照。
PDFコンバーター(HP参照)があるので、
やり方をチュートリアル、そのあとで各自それでもくもく、など
2.ロジックを扱う自然言語処理
機械学習とは毛色の違うアプローチを勉強したいです。
具体的には型理論に立脚した、ロジックを扱える自然言語処理です。
型理論に立脚したプログラミング言語(Haskell, Agdaなど)も勉強したいです。
例として以下の文献を検討しています。
Computational Semantics with Functional Programming
一例ですが、知識データベースを文字列で与えておいて、それを元に推論させたりします(述語論理の意味論)。
womenについて分かることを全て挙げてください、に対する回答が下です。
知識データベースに直接書いてないことも推論しているのが分かります。
【連絡先】
Connpass or 関数型玩具製作所の問い合わせフォームでお願いします。
【会のモチベーション】
文章の視認性を向上させるソフトウェア技術を開発しています。
知財業界(難しい文章を多読)の知見の応用です。
自然言語処理的なもの(句構造解析とか)を加えています。
この開発は3年くらい続けています。
発端は知財時代(特許検索)に使っていたハイライトを普通のPDFでも使いたいな、ということからスタートしています。
教科書、論文などの普通に読んだらきつい「固い系」の文書で効果的な技術です。
最近満足できるものが完成しました。ただし自分が満足しているのみです。
- 他の人はどうなのか
- 他の人の役にも立てる技術なのか
- 他の人の意見を入れたらもっと良いものになるのではないか
そういうモチベーションでこの会を企画しました。
(10年くらい長野市に住んでて、一昨年名古屋に帰ってきました)
自然言語処理にしても機械学習路線が席巻していますが、
ロジックを扱うものはまだ手薄と見ていますし、
個人的には前記路線では埋められない溝があると見ています。
難しいので研究者などの専門家以外にはポピュラーではなさそうですが、
逆に非専門家がこの武器を手に入れたら面白いのではないかと(実応用と直結)。
私もその筋の人間ではないので、みなさんと一緒に勉強できたらなと思っています。
(先述の読書ツールを使ったら一石二鳥かなと)
以上、長文を読んでくださりありがとうございました。 よろしくおねがいします。