וואָס מיר רעדן וועגן ווען מיר רעדן וועגן רייד
נאָך די אָטאַמאַטיק איבערזעצונג פון אַלע מיין אַרטיקלען אין פאַרשידן אנדערע שפּראַכן, איך סטאַרטעד צו טראַכטן וועגן וואָס ווייַטער מאָדערן און נוציק פֿעיִקייטן איך קען ימפּלאַמענאַד. ווייַל איר וועט זיין לעגאַמרע שטימען אַז לייענען מיין אַרטיקלען איז איינער פון די מערסט דילייטפאַל יקספּיריאַנסיז, איך געדאַנק אַז ניצן אַן אָטאַמאַטיק רעדע סינטעז דינסט קען פֿאַרבעסערן דעם אַרטיקל וקס. דעריבער, דער פּלאַן איז געווען פּשוט: איך וועט לייגן אַ נייַע קאַמף אין די אָנהייב פון אַן אַרטיקל טעקסט וואָס אַלאַוז וסערס צו הערן צו עס דורך די אַודיאָ שפּילער פון דעם בלעטערער.
ווי צו: רעדע סינטעז
נאָך די קוק פון די אַרקאַטעקטשער פון די איצטיקע אַפּ, די ווייַטערדיקע וואָרקפלאָוו איז ימפּלאַמענאַד צו פֿאַרבעסערן די PWA מיט אָטאַמאַטיק רעדע סינטעז און אַודיאָ שפּילער:
- ימפּלאַמענינג די סינטעז דורך GCP ס טעקסט-צו-רעדע-סערוויס ניצן די (פיל) פּריסער WaveNet אָפּציע אַנשטאָט פון דער נאָרמאַל איינער
- סטאָרינג די באשאפן mp3-טעקע אין Firebase Storage, אַ פּשוט טעקע סיסטעם אויך כאָוסטיד אין GCP; די נאָמען פון דער טעקע באשטייט פון דעם ארטיקל און די געוויינט לאָקאַל, וואָס גיט מיר אַ ימפּליסאַט שייַן און ויסמיידן די אַדישאַן פון אַ באַזונדער דאָקומענט וואָס האלט דערמאָנען צו אַלע URL ס פֿאַר אַ געגעבן רעדע.
- דערנאָך רוף איך די צוויי סטעפּס אויבן אויף די Vercel סערווער ווען איר שאַפֿן אָדער דערהייַנטיקן אַן אַרטיקל בלאַט, וואָס דערווייַל כאַפּאַנז יעדער 24 שעה מאַקסימום
- ניצן פויל לאָודינג פֿאַר די וועב שפּילער אין פאַל אַ אַודיאָ URL איז בנימצא
זייַענדיק פויל איז וויכטיק
איך טאָן ניט וועלן צו שאַטן מיין לאָודינג פאָרשטעלונג פֿאַר מיין וועב אַפּלאַקיישאַנז (און דעריבער די זוכן מאָטאָר ראַנגקינג), און דער וועב שפּילער איז לאָודיד אויף-מאָנען בלויז נאָך צוויי באדינגונגען זענען באגעגנט:
- אַן אַודיאָ URL פֿאַר דעם אַרטיקל איז אַקשלי בנימצא, וואָס דערווייַל אַפּלייז בלויז פֿאַר ענגליש טעקסטן צו דער הויפּט האַלטן קאָס אַראָפּ
- א באַניצער קליקס אויף די שפּיל-קנעפּל, ינדאַקייטינג די פאַרלאַנג צו אַקשלי הערן צו די לייענען געזונט אַרטיקל
פארוואס ניט אַלע שפּראַכן (איצט)?
רעכט צו נוצן Google's WaveNet ווי די פאַקטיש רעדע סינטעז מאָדעל, איך האָבן צו באַטראַכטן קאָס פֿאַר דעם שטריך ווי אַ הויפּט דייַגע. WaveNet באַניץ קאָס פיר מאָל די סטאַנדאַרט סינטעז מאָדעל. אָבער איך'ווע אויסדערוויילט עס ווי WaveNet זייער אַוטפּערפאָרמז רובֿ אנדערע מאָדעלס, ניט בלויז פֿון Google זיך, אָבער אויך IBM, פֿאַר בייַשפּיל.
נאָר דער אָנהייב
דאָס איז געווען אַ שנעל איבערבליק ווי איך ימפּלאַמענאַד רייד סינטעז אין אַ ערשטער ווערסיע פֿאַר דעם פּוואַ. די צייט צו קאָד גענומען בלויז אַ ביסל שעה, ווייַל איך איז געווען רובֿ פון די סעטאַפּ דורכגעקאָכט דורך זייַענדיק אַ גקפּ קונה. די דזשענערייטאַד רעזולטאַט סאָונדס ינקרעדאַבלי גוט, וואָס ווייזט די סטרענגטס פון WaveNet און ML- באזירט אַפּראָוטשיז צו רייד ווי געזונט ווי טעקסט האַנדלינג. א צוקונפֿט ימפּלאַמענטיישאַן קען לייגן די לייענען הויך פֿאַר אַלע שטיצט שפּראַכן. באַזירט אויף די נוצן און קאָס אין די אַפּקאַמינג חדשים, איך וועל באַשליסן ווי אַזוי צו פאָרזעצן אין דעם פאַל.
טאָם