همچنین اگر اخبار این حوزه را تعقیب کرده باشید، حتما در جریان گامهای بزرگی که اخیرا اپل (در سیستم عامل iOS 10 خود) و مایکروسافت (در به روز رسانی مخصوص سالگرد ویندوز ۱۰ خود) در این راستا برداشتهاند قرار گرفته اید. بنابراین چندان غیر طبیعی نیست که اینبار نوبت گوگلیها باشد که چیز جدیدی رو کنند.
برگ برندهی جدید گوگل، WaveNet نام دارد. یک فناوری پیشرفته که به دستیار صوتی این شرکت اجازه میدهد با صدا و لحنی شبیه به یک انسان واقعی با کاربر خود صحبت کند. برتری فناوری WaveNet بیش از هرچیز در این اســت که بهتر از هر سرویس روخوانی متن یا همان Text-to-Speech دیگری میتواند متن را تبدیل به صوت کند.
بهتر از چه لحاظ؟ از این نظر که خروجی این سیستم، بیشتر از هر سیستم دیگری شبیه به حرف زدن انسان اســت. سیستم WaveNet روی مغز متفکر هوش مصنوعی گوگل یعنی DeepMind سوار شده و میکوشد با استفاده از الگوهای شبکهی عصبی، صدایی نزدیکتر و واقعیتر تولید کند.
البته سرویسهای دیگری مانند Siri اپل و Alexa از شرکت آمازون هم از این الگوها بهره میگیرند. اما تفاوت WaveNet با این سرویسها اینجاست که سرویسهای دیگر برای صحبت کردن با مخاطب خود از یک بانک اطلاعاتی بزرگ از کلمهها و عبارات استفاده میکنند و با کنار هم گذاشتن این تکهها، جملهی خود را میسازند. به همین دلیل، طنینی بیروح و ماشینی دارند. اما سرویس جدید گوگل به جای این کار، سعی میکند با استفاده از هوش مصنوعی خود، کل ساختار آوایی جمله را از اول تولید کند.
البته قابلیتهای این سرویس به حرف زدن ختم نمیشود و بر خلاف سرویسهای دیگر، میتواند انواع و اقسام صداها و حتی موسیقیهای مناسبی را هم برای شما سر هم کند. حالا بهتر میتوانیم دلیل توسعهی سیستمهای هوش مصنوعی هنرمند گوگل را که قبلا از آن شنیده بودیم بفهمیم.