こんにちは、Kanot(狩野)です。最近Chat GPTの話を聞かない日はないくらい話題になってますし、使ってる人も増えてきましたよね。そんな食傷気味な中での記事で恐縮ですが、今日はChat GPTと「言語の壁」をテーマに一つ記事を書いてみようと思います。(Image by Shaun from Pixabay)
いきなり結論ですが、僕はChat GPTの一番画期的な点は、日本人を「言語の壁から解放しつつある」ことなのではないかと感じています。
どういうことか、詳しく説明していきますね。
これまでのネット検索での言語の壁
今まで皆さんは情報を得たい時は、どのようにしてインターネット上で調べていましたか?おそらく多くの方がGoogleやBingなどの検索サービスで調べていたのではないでしょうか?
しかし、これらの検索サイトで調べる場合、日本語で調べることのデメリットが発生しています。例えば、「国際開発」でGoogle検索をすると、検索結果は1.5億件です。一方、英語で「International Development」と検索すると、結果はなんと38億件であり、同じことを調べてもその結果の差は20倍以上です。
これは以下の図ような状況が発生しているからだと思われます。つまり、日本語検索は主に日本語のデータベースから検索され、英語検索だと主に英語のデータベースから検索されます。そして、その情報のサイズが日本語と英語ではレベルが違うため、検索結果もこのような差が出てしまいます。
Chat GPTはここが違う!
では、Chat GPTの登場によって何が変わったのでしょうか?それは、Chat GPT自体に翻訳の機能があるため、日本語で検索しても英語で検索しても、同じデータベースから回答を生成し、それを検索した言語で出力してくれるという点です。以下のようなステップと考えられます。(私の予想も入ってます)
- 自分の言語でChat GPTに質問
- Chat GPTがその質問を英語に翻訳する
- 世界中のデータベース(現在は主に英語)から回答を生成
- 英語で質問への回答を作り出す
- 質問者の言語に翻訳して質問者に回答
ちょっと文字だけだとわかりにくいので、図にしてみました。
これの何が画期的なのかというと、上下の図を比べていただけるとわかるのですが、Chat GPTは日本語で検索しても英語で検索しても、同じデータベースを使っているという点です。つまり、以下ようなメリットが日本人にはあるのではと思います。
- 何語で検索しても、検索した言語で返ってくる
- 何語で検索しても、同じデータをもとに回答が生成される
- つまり、言語によるデータ量の差という壁が乗り越えられる!
- つまりつまり、言語の壁という障壁が限りなく小さくなりつつある!!
- つまりつまりつまり、日本語でも世界と対等に戦える!!!
ちょっと興奮してしまいましたが、日本語で検索しても英語のデータベースから情報を取ってきてくれる、そしてそれが日本語で出力される、というのは本当に画期的だと思っています。Google検索登場以来、言語の差によって辛酸を舐めてきた日本人にとっては逆転のチャンスとも言える状況なのではないかとすら思います。
具体例
ではここで、実際のChat GPT(GPT-4)の画面を使って具体例を使って検証してみたいと思います。
まずは、日本語でICT4D界の代表する研究者であるミシガン大学の外山健太郎(Kentaro Toyama)教授の実績について聞いてみました。
外山教授の実績はデータにないとのことでした。同じことをGPT 3.5に聞くと、平気な顔して嘘の回答をするので、知らないことを知らないと言えるGPT 4に好感を持ちました。
一方、「いやいや、外山教授の実績がデータにないってことはないだろう」と思い直し、固有名詞だけ英語に変えてみました。(ミシガン大学をUniversity of Michiganに、外山健太郎をKentaro Toyamaに修正)
出ました出ました。名前がケンタロウ・トヤマではなくケンタロ・トヨアマとなっている点を除けば、ほぼほぼ正しい情報で回答を得られました。なるほど、聞き方で固有名詞を英語にしてあげるだけでこれだけ検索結果が改善するんですね。
では、これを英語で聞いた場合、情報はどのくらい変わるのでしょうか?
なんと・・・・、日本語で聞いた場合(固有名詞だけ英語)とほぼ同じでした。これは、聞きかたさえ気をつければ、日本語で調べても英語で調べても同じ結果が得られるということであり、言語の壁がこれまでより遥かに低くなったということですね!いやー、すごい。
これらの具体例から言えることとしては、Chat GPT自体の翻訳能力は非常に高いが、なるべく英語データベースでもヒットしやすいような聞き方(プロンプトとも呼ばれます)や単語を使ってあげることが重要なようですね。(今回で言うと、外山健太郎ではなくKentaro Toyamaと投げてあげるなど)
ただ、Chat GPT自体も、現在は主に英語のデータベースで訓練されているそうですが、今後もっと多言語での訓練がなされてくると、より高性能になってくる可能性は大いにあります。この場合、逆に言語の壁で守られてきた日本語のみの情報が、海外の人からも得られるようになってしまうというリスクも含みますね。
まとめ
Chat GPTが巷で話題になっており、学校で使わせるべきか?とか、頭良すぎ!とか、ホワイトカラーの仕事が失われる!とか色々と見解が出ています。実際に(特にGPT4は)凄まじいものが出てきた、と畏敬の念も正直感じます。
一方、この記事で書いたように、Chat GPTは非英語圏の人たちこそ最大の恩恵を受けられるのではないかとも感じており、日本再興に向けた一つのツールとして前向きに活用されていくことを願うのみです。
なお、この記事の内容、図は私の私見・予想をもとに作り・書いてみたものです。専門家の方から見ると事実と異なる点もあるかもしれません。その場合はご遠慮なくツッコミ入れていただけたらと思います。適宜修正していきます。
コメント