■掲示板に戻る■

自然言語処理は使えない?

1 名前:名無し象は鼻がウナギだ! :01/02/15 22:02
機械翻訳ソフトや音声認識ソフトを使ってみたが
どうしてあんなにアホな動作をするのか?
後で修正することを考えれば最初から使わないほうがましである。
自然言語処理は仮名漢字変換でしか使い物にならないのか?

2 名前:名無し象は鼻がウナギだ! :01/02/15 22:09
翻訳ソフトについては理系一般板にいまちょうどレスした。アホなのはしょうがないって事で。
http://2ch.server.ne.jp/2ch/test/read.cgi?bbs=rikei&key=970151147
音声認識についてはようわからんが、市販ソフトなんかは基本的にトライグラム使ってるだけだろうから、これもアホな文章になるのはしょうがない。
かな漢字変換は、あんまり言語処理って感じじゃないがなあ (オレskkだし)。
とりあえず何をとってもまだ未熟というしかないね、自然言語処理は。

3 名前:名無し象は鼻がウナギだ! :01/02/16 00:56
同音異義語などを判別するには翻訳ソフトがわれわれの世界を
理解していないと無理なんじゃないかな?

4 名前:鼻無し象はウナギという名だ! :01/02/16 06:36
人口知能が実現しない限り無理。


5 名前:名無し象は鼻がウナギだ! :01/02/16 12:07
>>3
結局そのとおりだと思う。
そういうことを、いまは統計的に処理している (よく使われる単語を
優先するとか、近くに関連分野の単語が出てたらそっちの
用語を推測するとか)。ほかにやりようがないからね。
このアプローチがつづく限り言語処理はアホのままだよ。
ブレイクスルーがないんだ。

6 名前:添削>4 :01/02/16 17:02
人口知能 ⇒ 人工知能



7 名前:名無し象は鼻がウナギだ! :01/02/16 20:44
統計的な処理をやっている時点で研究を放棄しているとしか思えない。

8 名前:名無し象は鼻がウナギだ! :01/02/17 17:10
メーカとしては、アホなユーザが騙されて買ってくれりゃそれでいいんだよ。

9 名前:名無し象は鼻がウナギだ! :01/02/18 04:37
UFOは『半重力装置が実現しない限り無理』
にわとりは『たまごが存在しない限り存在できない』

当たり前のことを当たり前のように言っているようでは無理。

10 名前:名無し象は鼻がウナギだ! :01/02/19 23:22
>統計的な処理をやっている時点で研究を放棄しているとしか思えない。

去年月刊言語で自然言語処理の人が連載してたけど、
天体の運動の計算について、最初は地動説に基づいて計算するよりも
「天動説+こまごまとした帳尻合わせ」のほうが予測の制度はよかったらしい。
でも最終的には天動説よりも正確に計算できるようになった。

で、言語処理でもまず単純で真理を捉えた理論からはじめて
システムをつくるようにしよう(「知る」→「作る」)と考えた。
でも「現実に役に立つもの」にしようとした途端にそれ自体天動説的な
つぎはぎシステムに結局なってしまうらしい。

90年代以降は経験主義的な方法t論が台頭したけど
「システムがなぜ動くか」の理解からは離れていく(作る>知る)
というジレンマがあるのだとか。


11 名前:名無し象は鼻がウナギだ! :01/02/22 21:57
言葉がボロボロに破壊されるから使わない。

12 名前:ラーメン大好き@名無しさん :01/02/23 10:07
言語自体が論理的でないから

人間が論理的な言語を実践できるようになれば、実現可能


13 名前:名無し象は鼻がウナギだ! :01/02/24 00:46
>>12
責任点火

14 名前:点火 :01/02/24 01:14
アチチ。

15 名前:名無し象は鼻がウナギだ! :01/02/24 07:54
>>12
「言語が論理的でない」って言い過ぎじゃん?
今の研究で使ってるロジックとは適合しないってことでしょ
生物コンピュータとか出てきたら、また違ってくるかもね」

16 名前:名無し象は鼻がウナギだ! :01/02/27 02:37
日英語以外ではどうなの?
さっき朝鮮語と日本語ではかなり精度がいいって聞いたけど。

17 名前:名無し象は鼻がウナギだ! :01/02/27 04:02
ハングルの自動翻訳サイトがどっかにあったけど、英語にくらべて
ホームページ食わせるとかなり読める文章が吐き出される。
これほんと。

18 名前:名無し象は鼻がウナギだ! :01/02/27 15:53
>>17
ハングルの場合、単なる逐語訳で
ある程度読めちゃうからねえ。
でも英語の自動翻訳にかけてるお金の
千分の一ぐらい投資して本気で作れば
もっときちんとしたものができそうだけど。

19 名前:名無し象は鼻がウナギだ! :01/02/27 22:48
日本語も朝鮮語も膠着語で文法が似ているから。
漢字にすれば共通の単語多数だし。


20 名前:名無し象は鼻がウナギだ! :01/02/28 13:38
ハングルの他にうまくいきそうなのは何語ですか

21 名前:名無し象は鼻がウナギだ! :01/02/28 20:02
モンゴル語は?良くは知らないけどこれも日本語と
文法が似てるらしい。

22 名前:名無し象は鼻がウナギだ! :01/02/28 20:04
文法と語彙が似ていることが条件なので、
文法だとトルコ語、モンゴル語かな(需要なさそう・・)
語彙だと中国語ぐらいか。
ハングルは両方とも日本語との共通点が多いので
逐語訳でだいたいいけてしまうのです。

23 名前:名無し象は鼻がウナギだ! :01/03/02 20:43
何れにせよ、何語だろうが原文を解析できていない。

24 名前:名無し象は鼻がウナギだ! :01/03/05 23:26
自然言語処理はコンピュータが最も苦手とするジャンルです。
コンパイラの延長であると安易に考えているのは大間違い。

25 名前:名無し象は鼻がウナギだ! :01/03/07 21:13
自然言語でコンピュータとを操作するのは無理ですか?

26 名前:名無し象は鼻がウナギだ! :01/03/07 21:15
>>25
コンピュータとを>コンピュータを

27 名前:名無し象は鼻がウナギだ! :01/03/07 23:23
「自然言語でコンピュータを操作する」の意味を狭く取れば今でも十分可能だと思いますが

28 名前:名無しさん@1周年 :01/03/17 23:42
>>27
そういうのは「自然言語」とは言えませんが

29 名前:名無し象は鼻がウナギだ! :01/03/17 23:59
>何れにせよ、何語だろうが原文を解析できていない。

自然言語処理にとっての難点は文の解析よりは
語用論的な意味の問題とかでは?
文の解析はできてそうだけど。


30 名前:名無し象は鼻がウナギだ! :01/03/18 15:04
>>27
ぴゅう太の日本語BASICですか?

31 名前:名無し象は鼻がウナギだ! :01/03/18 17:32
>>30
Mind。http://www.scripts-lab.co.jp/。これはイイよ。

32 名前:27 :01/03/19 03:38
なんか話しそれてるけど。

>>25が「自然言語でコンピュータを操作する」っていうのが具体的に
どういうレベルのことかわからなかったので、>>27みたいな書き方をしたんだけど。

>>28
じゃ、どういうのを「自然言語でコンピュータを操作する」といってるの?


33 名前:名無しさん@1周年 :01/03/19 19:52
そもそも自然言語はコンピュータの操作には不向きだよ。

34 名前:名無し象は鼻がウナギだ! :01/06/21 04:05
sage

35 名前:むう。 :01/07/05 11:42
>>33
「今の」コンピュータには不向きですね。その意味で同意。
今のそれはあくまで「とてつもなく高機能な電卓の親玉」ですから。

対して、
人間の言語は何語でもそれを使う人間に都合よくできていて、
その裏にはそれぞれの文化を背景にした思考の流れがあり、それがわからないと
人間の言語を違和感なく機械翻訳してしまうのは容易ではなさそう。

翻訳ソフトの場合、たしかに「容易ではない」のですが、
あきらめずに全く別のアプローチから、「それっぽく見せる」事でそれなりの実用性を得るという
方法もありますね。
現状で最もいい方法と言えばそれは経験則的な「翻訳テクニック」の集合体だと思いますし
現在の翻訳ソフトはこの流れのものが多そうですが、
これにしてもまだまだ先は長そうです。

36 名前:名無し象は鼻がウナギだ! :01/08/06 02:32
age

37 名前:名無し象は鼻がウナギだ! :01/08/30 22:17 ID:li0mmNBY
 ,

38 名前:自然人 :01/09/02 02:39 ID:RYT.FyjE
自然言語処理のスキルが必要な転職を見つけたのですが、自然言語って
どれくらいのことが分かればおおむねOKなんでしょうか? 素人でも
頑張ればなんとかなりますか? また、どこの会社の処理が良いとかあ
れば教えてください。

39 名前:名無し象は鼻がウナギだ! :01/11/05 18:47
NECの「たび通」使ってみた人いる? どう?

40 名前:名無し象は鼻がウナギだ! :01/11/06 22:37
かな漢変換には充分お世話になってるはず。

41 名前:名無し象は鼻がウナギだ! :02/01/29 07:14
結局自然言語って、中途半端に論理的で、
中途半端に統計的なんだと思う。
曖昧性のない論理体系で表すことはおそらく不可能だろし。
かといって、経験的なマッチング?だけで、
普段自分が話をしているとも思えない。

とにかく俺はもう疲れた。やっぱ、就職する。

42 名前:名無し象は鼻がウナギだ! :02/02/16 20:35
>>12
正にそこにこそ、解決の糸口があるのでは?

43 名前:名無し象は鼻がウナギだ! :02/02/16 21:39
日本語は英語に比べ、文章を単語に分解する「形態素解析」が
まるまる余計に必要になる分、厄介なんだとさ。
と、自然言語処理やってる友人が言っていた。

あと、「自然言語処理の研究」とは9割方、
計算機用の辞書を作ったり探したりする作業だ、と、
やや自嘲気味に言っていた。

44 名前:名無し象は鼻がウナギだ! :02/02/17 06:14
翻訳ソフトやスペルチェッカー,“賢い”OCR,それに文法チェックなどを含めた
認識系のソフトウェアのことをはっきりと認識することは,私たちが完璧から
どれほど程遠いのかを本当に理解するための鍵になる。

http://www.zdnet.co.jp/news/0202/05/e_dvorak.html

45 名前:名無し象は鼻がウナギだ! :02/03/15 08:53
!                    

46 名前:名無し象は鼻がウナギだ! :02/05/04 11:25
あげ

47 名前:名無し象は鼻がウナギだ! :02/05/04 12:26
たまたま、このスレと隣あわせだったんで、コピペ。

http://mentai.2ch.net/test/read.cgi/gengo/1009134096/l50

>> 『生成日本語学入門』長谷川信子、大修館書店

オレ、コンピュータで自然言語処理やっているもんだけど、
上記の本なんて、C言語のポインタよりも理解しやすかったよ。
あの本が難しいなんていっている奴が、論文書いて
発表できるようじゃ、日本語言語学は暗いね。


48 名前:名無し象は鼻がウナギだ! :02/05/04 15:20
>あの本が難しいなんていっている奴が、論文書いて
発表できるようじゃ

 いやそんなやつはさすがにいないと思うが。

49 名前:名無し象は鼻がウナギだ! :02/06/01 16:29
>10:言語処理でもまず単純で真理を捉えた理論からはじめて
システムをつくるようにしよう(「知る」→「作る」)と考えた。
 単純で真理を捉えた理論なんてない(そう主張しているものはある)のだから、
失敗してあたりまえだ。
 言語学者のホラを真に受けた者が悪い。

50 名前:名無し象は鼻がウナギだ! :02/06/28 10:31
自然言語処理には,いろいろ問題があるのは事実。でも,企業や研究
機関は,自然言語処理の専門家を採用してくれる。生成文法の博士を
採用する企業・研究所はあるか?

生成文法は「趣味」として勉強するのには面白いが,生活はできない。


51 名前:オマンコはおいしい :02/06/28 12:29
>>50
それは「生成文法」っていうより、「未仁摩栗鼠吐」でしょ?
LFGやHPSGなら企業・研究所への就職はそう難しくない。
もともと共同研究なんかも多いので。これはアメリカでも同じ。

52 名前:名無し象は鼻がウナギだ! :02/06/28 13:44
自然言語処理は近代経済学。経済政策や予測を行うが,うまく
行かないことが多い。

生成文法はマルクス経済学。学者のお遊び。実用性ゼロ。


53 名前:名無し象は鼻がウナギだ! :02/06/28 15:08
>>51
就職できても、結局役に立たなかったことが2−3年でわかる。


54 名前:名無し象は鼻がウナギだ! :02/06/28 15:30
ttp://www.icot.or.jp/ARCHIVE/Museum/HISTORY/92-J.html ICOT失敗の言い訳

>例えば、機械翻訳システムなどの応用システム自体の開発はプロジェクトの目標か
>らは消えていました。高度に知的なシステムを10年で完成させることは不可能で、
>その前段階として、基礎研究の充実とか、コンピュータ技術自体の改作が必要にな
>ります。むしろ、それをプロジェクトの内容にすべきだというのが私たちの判断で
>あったからです。一方日本では、現実的な、低いレベルでの機械翻訳システムの開発
>などは、既に民間企業の自発的な、競争的な段階に入ろうとしていたという事情もあ
>ったのです。

「現実的な、低いレベルでの機械翻訳システム」すら作れなかったのに、よく言う
もの。

55 名前:名無し象は鼻がウナギだ! :02/06/28 16:05
中国やロシアでマルクス主義経済学の教員はいないけど,日本の
大学には,まだたくさんいる。チョムスキー言語学も,チョムスキ
ーが死んでも,日本の大学では教え続けられるよ,きっと。

近代経済学と同じで「低いレベル」でも,自然言語処理は必要性
がある。マルクス主義経済学やチョムスキー言語学は,学者が
勝手にやってればいいので,今の若い大学院生が研究する対象で
はなくなった。

56 名前:名無し象は鼻がウナギだ! :02/06/29 00:36
なんとなく、自然言語処理を独習してます。
すみませんが、どなたか教えて下さい。

日本語の形態素解析で使い勝手のよいソフトって何でしょう。
WinでもUNIXでも構いません。

57 名前:名無し象は鼻がウナギだ! :02/06/29 03:34
茶筌でいけない理由を陳べよ

58 名前:名無し象は鼻がウナギだ! :02/06/29 12:48
8月末にコンピュータ言語学会がある。
ttp://www.coling2002.sinica.edu.tw/


59 名前:名無し象は鼻がウナギだ! :02/06/29 13:10
http://isweb43.infoseek.co.jp/play/ta-bo-z/index2.htm

60 名前:名無し象は鼻がウナギだ! :02/06/29 21:21
>>57 THX
では、茶筅が一番いいという理由はなんですか。


61 名前:名無し象は鼻がウナギだ! :02/07/01 08:46
The notion of probability of a sentence is an entirely useless one,
under any known interpretation of this term.
(Chomsky 1969, Quine's empirical assumption, p. 57)

Chomskyは30年以上,この考え方を変えなかったが,現在,
スペルチェック,音声認識など自然言語処理では,どれもN-grams
を使って,ある程度,成功している。N-gramsを否定しようとした
Chomskyたちの研究は何だったんだ?!

マルクス経済学でも,日本の大学にに3名程度,学者を残しておくのには
反対しないが,毎年,50名以上の大学院生を受け入れるのは,若い彼ら
の将来のためにもよくない。

チョムスキー言語学のような学者のお遊びは,企業が相手にしない
だけではく,国民の税金からも研究費など出せない。



62 名前:まじめに質問です。 :02/08/03 04:22
自然言語処理に興味があります。プログラミングを勉強したのですが、
どういった言語を勉強しておくべきなのでしょうか?

63 名前:名無し象は鼻がウナギだ! :02/08/03 09:56
>>56
自分で作れよ。
日本語の形態素解析みたいなのにくらべれば、コンピューターのプログラミング
言語なんてモノは遙かに単純で簡単だ。プログラム屋に日本語の形態素解析みた
いなものを理解させるよりも、日本語の形態素解析を理解している人がプログラ
ムを斯く方が、ずっと早く正確にものができる。
UNIXでもいいのなら、ホンモノのUNIXかどうかは異論があるけれども、とりあえ
ずLinuxかFreeBSD。よっぽど特殊な要求しない限りはタダでC/C++のコンパイラ
ーまで付いて使えるから、おすすめ。

>>62
プログラミング言語なら、どれも、文字列操作とか数値統計みたいなことは
できるから、どれを使おうとさして違いはない。
但し、情報処理試験に出てくるCASLは実用でないので、やめとけ。
流行廃りはある。流行ってるものは、C++、VisualBASIC、Java、Delphi、
Kylixなど。
金のかからないのは、Linux入れれば標準でついてくる、GCCのC++。千円
かそこらの雑誌についてくるCDでインストールするか、配布サイトから
ダウンロードするか。
Windowsでやりたいなら、マイクロソフトのVisualStudio。VisualBASIC、
C++、JAVAと一通り入ってる。マイクロソフトのC++とGCCのC++では、作法が
かなり違うぞ。





64 名前:名無し象は鼻がウナギだ! :02/08/15 15:58
>>62
茶筅やらKNPやらを呼び出すつもりならPerlが便利かな。
あとC言語くらいは教養で知っていてもいいと思う。


65 名前:名無し象は鼻がウナギだ! :02/08/15 17:01
日本語ならChaSenとかあるんですが、フランス語のイイ
形態素解析ツールって、どなたかご存知ないですか?

66 名前:名無し象は鼻がウナギだ! :02/08/16 12:51

   ,, -‐'´~ ̄                    ゝ  だがな ひろ… 俺はいらねえんだ………
.∠~_  _  ll   ll    lll    ll   ll  ll \ そんな倉庫逝きを免れるためだけのレス…
.  , ‐'"~ ll   lll   lll    ll   lll   ll   ヾ ひろ… 俺たちは2ちゃんねらーの前
./  ll __,  ll   ll    ll   lll    ll   lll ヽ  なんだったかな…?
 , -‐'/ ll  ll   ll/| lll ∧ ll   lll    ll    l  スレはつながっている… 随分前から…
.´ ./ ll  lll  /ll / .| | _,|ll .∧   ll     ll  |  俺はそんな考えをもつようになった…
 / l/ ll  / /_| /''‐-‐|ll| _,,| |. | llヘ、 ll   ll   ll | 2ちゃんねらーとしての俺が滅んだら
/// ll /| /_|/ |/` ‐-‐ '|.|, -'|l| ̄|.|:::\  ll  ll  |  スレは過去ログ倉庫に逝って
.  l /|../ |/  l``ヽ、   /|!   l  l :::\  ll  ll|  その後何年か経っても… 閲覧が可能だ
. |/ |l/ l|.=====、  __ ========::::| .l⌒ヽ .| だから俺はいつスレが氏んだって構わない
   l   | ` ‐--゚‐/,::: '''' ` ‐-゚--‐ ' ´  ::|ll|⌒l | |    スレは永遠
      | 、.__ /,::::::::   、_      _ノ :::| |⌒l |lll|   過去ログ倉庫に保存されるんだからな…
.      |  ::/,:::::::::::::     ̄ ̄ ̄   ::::|l|6ノノ .|\   ただ唯一問題なのは
.        |././,:::::::::::__:::)   \__   :::::::||、_ノ | ・\ 2ちゃんねらーとしての俺がくたばった時
.         l.(_::           ,\::::::::/l   ll| ; : | このスレが「俺のスレ」だという気持ち
.         l.   ̄ ̄ ̄ ̄ ̄ ̄ ̄ :::::::/ | lll | :・ ・;|  意識が吹っ飛ぶ…
           l、    ___    ::::::/:   | ll| ;・ :・| そこが問題だ… つまり平たく言やあ…
        _, -/l、    ̄ ̄   :::::/::    | | ・ ; ;| 倉庫逝きは恐くない いつでも逝ける
    _, -'::l::::/ ; !.        ::::/:::     |.| ; : ; ・ |  俺が恐れるのは
    ::l:::::l:::/;'・':ヽ、     :::/:::       | ;・; :;| スレが俺のスレでなくなること
   ::l:::::l::/; ・' : l ヽ、  ::/:::       /l :  ・ ;: | それだけはご免だ
   l:::::l:/・: ;; l・ ;lヽ/:::         /''| ; ・ ;; ・|  そこだけは譲れない……
   ::::l/ ・; ;:|;;・'|::::         /: | : : ・; ; | わかるか…? 俺は…
   ::/ :;・ ・.,:へ.・; |            /;, へ ;; :・ | たとえageるにしろ sageるにしろ
   / ;;・ //:・'\ |          //;・ |:\ ・;・ ;|  赤木しげるとしてage
    ・:./:::/ ;; :'0,|         /:・ ;; |::::::\;; ・ |   sageたいのだ…

67 名前:名無し象は鼻がウナギだ! :02/08/22 11:23
漢文の読み下しなんか、一種の自然言語処理だよなぁ。機械的にどんどん
訳していける。

68 名前:名無し象は鼻がウナギだ! :02/08/23 00:48
<<67
What do you mean?

69 名前:名無し象は鼻がウナギだ! :02/08/24 00:54
>>67
なにゆえ漢文?そうやってキサマが下らんカキコしてるのも
立派な「自然言語」処理だよ。

70 名前:70 :02/08/26 00:22
>>65
http://nobu.homelinux.net/~nobu/form.html

71 名前:65 :02/08/26 18:59
>>70
ありがとうございます。

72 名前:名無し象は鼻がウナギだ! :02/08/26 23:24
大学で自然言語処理論取ってたんだけど、ちんぷんかんぷん。
レポート提出できませんでした。捨てたというより見逃しの三振。
手も足も出なかった。まあ取った自分が悪かったんだけど(単位取得の
ため)単位落としてしまった。
でも先生もちんぷんかんぷんを続行するだけで救済措置全く無し。
ついて行けてる生徒がいるかどうかも皆把握できず終了。
ちびっと授業料損した感じでした。
こんな私はダメポでしょうか?

73 名前:77 :02/08/27 13:08
例えば、一個の単語が必ず一個の意味しかもたなかったら
翻訳なんて簡単だろうね

74 名前:名無し象は鼻がウナギだ! :02/09/01 22:02
knp をサーバモードで動かすのってどうやんの?
juman は -S オプションでできるみたいだけど。

75 名前:名無し象は鼻がウナギだ! :02/09/01 23:12
>>74
「サーバモードで動け!」
と念じる。

76 名前:名無し象は鼻がウナギだ! :02/09/05 20:26
保守age
このスレすぐ落ちるなぁ

77 名前:名無し象は鼻がウナギだ! :02/10/09 10:09
猛火たることはなしや

78 名前:名無し象は鼻がウナギだ! :02/10/09 19:12
いま、個人かつ半分マジで自然言語処理の勉強してます。つーても目標は英⇒和
のみですが。

ところで統語論と形態論は、どちらが自然言語処理に役立つのでしょうか?
形態論はまだ本すら読んだこともないのでさっぱりわかりません。
とりあえず「入門ミニマリスト統語論」は3/4程読んでいます。

79 名前:名無し象は鼻がウナギだ! :02/10/09 22:03
>>78
言語によって違うずら。
格語尾豊富に持ってる言語は、形態論が大きな比重を占めるが、
英語みたいに形態変化が少ない言語は統語論だな。
日本語は、分かち書きがないから形態解析が重要。chasenって
知ってるでしょ。でも、決め手は、辞書だわ。




80 名前:78 :02/10/10 13:11
>>79 なるほど。レスありがとうございます。


81 名前:名無し象は鼻がウナギだ! :02/10/11 00:23
chasen と juman ってどう違うの?

82 名前:名無し象は鼻がウナギだ! :02/10/11 05:12
chasenのページ見れば書いてあるから、書いてないこと書くと、
chasenの方が文法定義なんかの環境設定ファイルいらないから
使いやすい。chasenは辞書もときどき改良を重ねてるから、
制度がよりいい。


83 名前:名無し象は鼻がウナギだ! :02/11/10 18:56
jumanの辞書ってchasenで使える?

84 名前:山崎渉 :03/01/06 23:23
(^^)

23 KB
戻る
DAT2HTML 0.31a Converted.