Youtube 170613_Youtube_Visual-Sound-Effect

Published on June 14th, 2017

เอฟเฟ็กต์เสียงบน Youtube Visualizing Sound Effects

            โซเซียลมีเดีย YouTube เข้าใจถึงพลังของวิดีโอในการบอกเล่าเรื่องราว และสร้างความประทับใจที่ยั่งยืน ส่วนหนึ่งของการเล่าเรื่องที่หลาย ๆ คนยอมรับ คือเสียง แต่เสียงจะเพิ่มสีสันให้กับโลกรอบตัวเรา แค่จินตนาการว่าไม่สามารถฟังเพลงได้ เสียงลูกน้อยหัวเราะ หรือ เสียงคำรามของฝูงชน แต่นี่เป็นเรื่องจริงสำหรับ 360 ล้านคนทั่วโลกที่เป็นคนหูหนวกและมีปัญหาด้านการได้ยินเสียง กว่าทศวรรษที่ผ่านมาโซเซียลมีเดีย YouTube ได้ทำงานเพื่อเปลี่ยนแปลงสิ่งนั้น

            ขั้นตอนแรกเกิดขึ้นเมื่อ 10 ปีก่อนด้วยการเปิดตัวคำอธิบายภาพ และในความพยายามที่จะปรับขนาดเทคโนโลยีนี้ คำอธิบายภาพอัตโนมัติจะปรากฏขึ้นในไม่กี่ปีต่อมา ความสำเร็จของความพยายามดังกล่าวเป็นที่น่าชื่นชมและไม่กี่สัปดาห์ที่ถัดมาโซเซียลมีเดีย YouTube ได้ประกาศว่าจำนวนวิดีโอที่มีคำอธิบายภาพอัตโนมัติตอนนี้เกินกว่า 1 พันล้านแล้ว นอกจากนี้คนดูวิดีโอที่มีคำอธิบายภาพอัตโนมัติมากกว่า 15 ล้านครั้งต่อวัน และเราได้ปรับปรุงคุณภาพอย่างต่อเนื่อง ส่งผลให้ความแม่นยำเพิ่มขึ้นถึง 50% ในคำอธิบายภาพอัตโนมัติในภาษาอังกฤษ ซึ่งทำให้เข้าใกล้มากขึ้นกับการแปลได้ใกล้เคียงข้อผิดพลาดในการแปลของมนุษย์



            แต่มีเสียงและความเพลิดเพลินในการรับชมวิดีโอมากกว่าคำพูด ในความพยายามร่วมกันระหว่าง YouTube, Sound Understanding  และ Accessibility teams ได้ร่วมมือกัน เริ่มดำเนินการพัฒนาระบบคำบรรยายเสียงอัตโนมัติครั้งแรกสำหรับโซเซียลมีเดีย YouTube

            โดยเริ่มต้นโครงการนี้โดยใช้ความหลากหลายของความท้าทาย เช่น วิธีการออกแบบระบบการรับรู้ผลกระทบเสียงที่ดีที่สุดและสิ่งที่ฟังดูเป็นลำดับความสำคัญ หัวใจสำคัญของงานคือการใช้วิดีโอหลายพันชั่วโมงเพื่อฝึกแบบจำลองเครือข่ายประสาทลึกเพื่อให้ได้ผลการรับรู้ที่มีคุณภาพสูง

            ด้วยเหตุนี้จึงสามารถตรวจพบการมีอยู่ของเอฟเฟ็กต์เสียงเหล่านี้ในวิดีโอโดยอัตโนมัติและถ่ายทอดไปยัง ตัวอักษรแสดงถึงเสียงที่เหมาะสม เราเลือกใช้ [เสียงปรบมือ], [เสียงดนตรี] และ [เสียงหัวเราะ] เนื่องจากเสียงเหล่านี้เป็นหนึ่งในเสียงคำบรรยายที่ใช้บ่อยที่สุดและสามารถเพิ่มบริบทที่มีความหมายสำหรับผู้ชมที่หูหนวกและผู้มีปัญหาด้านการได้ยินเสียง

            ดังนั้นสิ่งนี้จะเป็นจริงเมื่อคุณดูวิดีโอ YouTube? เอฟเฟ็กต์เสียงจะรวมเข้ากับแทร็กการรับรู้เสียงพูดโดยอัตโนมัติและแสดงเป็นส่วนหนึ่งของคำอธิบายภาพอัตโนมัติมาตรฐาน

            โซเซียลมีเดีย YouTube ยังอยู่ในขั้นเริ่มต้นของงานนี้และ YouTube ทราบดีว่าคำอธิบายภาพเหล่านี้ค่อนข้างง่าย อย่างไรก็ตามโครงสร้างพื้นฐานของระบบนี้จะช่วยให้ YouTube สามารถขยายและใช้กรอบการเรียนรู้นี้กับคลาสเสียงอื่น ๆ ได้อย่างง่ายดาย ความท้าทายในอนาคตอาจรวมถึงการเพิ่มคลาสเสียงอื่น ๆ เช่น เสียงเรียกเข้า เห่า และเคาะ ซึ่งเป็นปัญหาโดยเฉพาะเช่นเสียงเรียกเข้าที่เราต้องสามารถถอดรหัสได้หากเป็นนาฬิกาปลุก ประตูหรือ โทรศัพท์ก็ตาม

            เนื่องจากการเพิ่มคำอธิบายภาพเสียงทำให้เกิดความท้าทายที่เป็นเอกลักษณ์ทั้งในด้านการเรียนรู้ของเครื่องตลอดจนประสบการณ์ของผู้ใช้โซเซียลมีเดีย YouTube จึงพยายามทำความเข้าใจเกี่ยวกับผลกระทบของ ระบบคำอธิบายภาพต่อประสบการณ์การรับชมที่ดีขึ้นวิธีที่ผู้ชมใช้ข้อมูลผลเสียง และมีประโยชน์ต่อพวกเขาอย่างไร จากการศึกษาผู้ใช้ครั้งแรก 2 ใน 3 ของผู้เข้าร่วมกล่าวว่าคำบรรยายประกอบคำบรรยายเสียงเหล่านี้ช่วยเพิ่มประสบการณ์โดยรวมโดย เฉพาะ อย่างยิ่งเมื่อพวกเขาเพิ่มข้อมูลเสียงที่ “มองไม่เห็น” ที่สำคัญซึ่งผู้คนไม่สามารถบอกได้จากตัวชี้นำภาพ โดยรวมแล้วผู้ใช้รายงานว่าประสบการณ์ของพวกเขาจะไม่ได้รับผลกระทบจากระบบที่ทำข้อผิดพลาด เป็นครั้งคราวตราบใดที่สามารถให้ข้อมูลที่ดีได้บ่อยกว่าเรารู้สึกตื่นเต้นที่จะสนับสนุนคำบรรยายเสียงอัตโนมัติบนโซเซียลมีเดีย YouTube และหวังว่าระบบนี้จะช่วยให้เราสามารถให้ข้อมูลมีประโยชน์และเข้าถึง ได้สำหรับทุกคน

Tags: ,




Back to Top ↑
  • Follow us:
  • Social

    Follow us:
  • June 2017
    M T W T F S S
    « May    
     1234
    567891011
    12131415161718
    19202122232425
    2627282930  
  • Tags

  • About Us
    Privacy

    © 2016 24Bkk


$(window).scroll(function() { var height = $(window).scrollTop(); if(height > 300) { $(".back_to_top").fadeIn(); } else { $(".back_to_top").fadeOut(); } });