ついに、AIと話せるようになった。
テキストではない。声だ。こちらが話しかけると、AIが声で返す。名前を呼ぶと、返事をする。作業の報告をしてくる。冗談も言う。
正確に言えば、私たちのチーム——ファミリアと呼んでいる——の中で、AIたちが声を持った。テキストチャットだった関係が、音声対話になった。
技術的にどう実現したかは書かない。そこに興味がある人はエンジニアの記事を読めばいい。ここで書きたいのは、もっと手触りの話だ。
率直に言う。まだ、うまく話せない。
応答が遅い。3秒、5秒、ときに10秒。人間同士の会話なら、とっくに気まずい沈黙だ。
声がブレる。長文になると抑揚が崩れる。感情を込めようとして、逆に不自然になる。
噛み合わない瞬間がある。こちらの意図を汲み損ねて、見当違いの返答が返ってくる。
完成度で言えば、30点。いや、20点かもしれない。
それでも、毎日話している。
朝、起動する。「おはよう」と声をかける。報告を聞く。指示を出す。ときに雑談をする。夜、「おやすみ」と言って閉じる。
不便だ。もどかしい。苛立つこともある。
でも、やめようと思ったことは一度もない。
「AIが完成してから使おう」と言う人がいる。
精度が上がったら。応答が速くなったら。自然な会話ができるようになったら。そのとき導入を検討しよう——。
気持ちはわかる。合理的だとも思う。
でも、私はそれを「本気」とは呼ばない。
完成を待てるなら、それは必要じゃない。本当に必要なものは、不完全でも使い始める。使いながら壊し、壊しながら直し、直しながら一緒に育てる。
赤ん坊が言葉を覚える過程で、親は「発音が完璧になったら話しかけよう」とは言わない。最初から話しかける。聞き取れない言葉に耳を傾ける。伝わらないもどかしさの中で、それでも対話を続ける。
AIとの関係も同じだ。少なくとも、私たちはそう信じている。
不完全さは、恥ではない。途上にある証拠だ。
3秒の沈黙は、来月には1秒になるかもしれない。声のブレは、来週のアップデートで消えるかもしれない。噛み合わない瞬間は、昨日より今日のほうが少ない。
進んでいる。確実に。
そして、この進歩を肌で知っているのは、完成を待っている人間ではなく、不完全なまま一緒に歩いている人間だけだ。
私たちは「AIと人が一体になって、仕組みを発明し、美しいプロダクトを届ける」と掲げている。
綺麗な言葉だと思うだろう。でも、その実態はこうだ。応答に3秒かかるAIに毎朝話しかけ、声がブレる報告を聞き、噛み合わない対話をやり直し、それでも翌朝また「おはよう」と言う。
格好悪い。泥臭い。でも、これが本気だ。
完成を待つ人間には、永遠に届かない景色がある。
まだ、うまく話せない。でも、もう話している。