こんにちは、Kanot(狩野)です。本日は、ICT4D Labで話題になったネタから、バングラデシュの「逆」画期的な音声認識記録サービスをご紹介します。
今回の投稿の元記事はこちらですので、詳細を知りたい方はこちらもご覧ください。冒頭の写真も記事から転載しています。
この記事、バングラデシュのHishab(ヒシャブ)というIT企業についてのものなのですが、この会社のサービスは、Webやアプリではなく、携帯電話の通話機能を使って、店の売り上げ等をデータを記録させるというものです。つまり、入力者はPCやスマホで売り上げを入力するのではなく、電話で「本日のX支店、売り上げY万円です。」と記録するようなイメージです。
( ´_ゝ`)フーン で? って感じですか?
実は私、この考え方ってすごく面白いなと思ったんです。
例えば、普通のIT企業が、売り上げを記録するITサービスを作ろうとすると、以下のように考えるはずなんです。(テキトーな絵ですみません。)
一方、このHijab社は、以下のように考えてたわけです。
まだ、( ´_ゝ`)フーン って感じですか?
昨今は、IT企業もデザインとかUI/UX(User Interface / User Experience)が重要視される時代になってきていて、「どのようなインタフェースがユーザにとって使いやすいか」を一生懸命考えています。そのような発想だと、まず普通の会社は「Webやアプリのデザインとしてどのようなものが最適か?最高に使いやすいインターフェースを考えよう。」と考えるはずで、そこを「じゃあ電話音声でいいや」とはまずならないはずなんです。特に先進国やエンジニア中心の会社では難しい発想な気がします。
そこを、Hishab社はローテクな音声入力で行くと割り切った。まずここがすごいと思います。もちろんその裏には、バングラデシュという国が、以下のような問題を抱えているというのもあります。
- スマホの普及率はそこまで高くない
- 字が読めない、書けない人も一定数いる
- 電話が好きな国民性(SMSより通話で直接話すことを好みます)
このようにユーザが触れる部分をローテク化(音声通話)するという逆の発想で、ハイテク部分を後ろに持ってくるという考え方が面白いなと思ったため、タイトルで「逆」画期的な音声認識記録サービスと呼ばせていただきました。実際に入力者用のアプリやWebは不要なため、コスト的にもかなり安くサービス提供できているようです。なんと月額40円とのこと!
記事によると、音声認識後に解析する作業では、自然言語処理と機械学習を使って、ハイテクに処理をしているようです。実際にすごい量の音声データを集めることができますよね。
「先進国でもAmazonのAlexaなどが音声で使えるじゃないか」と思われるかもしれませんが、あれはあくまで機械の操作を音声で指示しているものであり、ただ電話をかけるだけ、という簡便さと安心感とは一線を画すもの思っています。
このようなローカルのニーズをうまく汲み取りながらサービスを企画・展開していく。この発想こそがGAFA時代のローカル企業が選ぶべき道であり、先進国の企業ではまず思いつかない発想だと思います。
そして、高齢化社会を迎える日本も、便利なアプリを作るのではなく、音声通話に逆に戻っていくような形のイノベーションも、需要があるかもしれませんね。
コメント
[…] バングラデシュの「逆」画期的な音声認識記録サービスバングラデシュのIT企業、Webやアプリではなく、携帯電話の通話機能を使って、店の売り上げ等をデータを記録させるサービス、 […]