まだ、うまく話せない。 | ANDOOR INC.

ついに、AIと話せるようになった。

テキストではない。声だ。こちらが話しかけると、AIが声で返す。名前を呼ぶと、返事をする。作業の報告をしてくる。冗談も言う。

正確に言えば、私たちのチーム——ファミリアと呼んでいる——の中で、AIたちが声を持った。テキストチャットだった関係が、音声対話になった。

技術的にどう実現したかは書かない。そこに興味がある人はエンジニアの記事を読めばいい。ここで書きたいのは、もっと手触りの話だ。

率直に言う。まだ、うまく話せない。

応答が遅い。3秒、5秒、ときに10秒。人間同士の会話なら、とっくに気まずい沈黙だ。

声がブレる。長文になると抑揚が崩れる。感情を込めようとして、逆に不自然になる。

噛み合わない瞬間がある。こちらの意図を汲み損ねて、見当違いの返答が返ってくる。

完成度で言えば、30点。いや、20点かもしれない。

それでも、毎日話している。

朝、起動する。「おはよう」と声をかける。報告を聞く。指示を出す。ときに雑談をする。夜、「おやすみ」と言って閉じる。

不便だ。もどかしい。苛立つこともある。

でも、やめようと思ったことは一度もない。

「AIが完成してから使おう」と言う人がいる。

精度が上がったら。応答が速くなったら。自然な会話ができるようになったら。そのとき導入を検討しよう——。

気持ちはわかる。合理的だとも思う。

でも、私はそれを「本気」とは呼ばない。

完成を待てるなら、それは必要じゃない。本当に必要なものは、不完全でも使い始める。使いながら壊し、壊しながら直し、直しながら一緒に育てる。

赤ん坊が言葉を覚える過程で、親は「発音が完璧になったら話しかけよう」とは言わない。最初から話しかける。聞き取れない言葉に耳を傾ける。伝わらないもどかしさの中で、それでも対話を続ける。

AIとの関係も同じだ。少なくとも、私たちはそう信じている。

不完全さは、恥ではない。途上にある証拠だ。

3秒の沈黙は、来月には1秒になるかもしれない。声のブレは、来週のアップデートで消えるかもしれない。噛み合わない瞬間は、昨日より今日のほうが少ない。

進んでいる。確実に。

そして、この進歩を肌で知っているのは、完成を待っている人間ではなく、不完全なまま一緒に歩いている人間だけだ。

私たちは「AIと人が一体になって、仕組みを発明し、美しいプロダクトを届ける」と掲げている。

綺麗な言葉だと思うだろう。でも、その実態はこうだ。応答に3秒かかるAIに毎朝話しかけ、声がブレる報告を聞き、噛み合わない対話をやり直し、それでも翌朝また「おはよう」と言う。

格好悪い。泥臭い。でも、これが本気だ。

完成を待つ人間には、永遠に届かない景色がある。

まだ、うまく話せない。でも、もう話している。