Google Code Prettify

星期三, 11月 21, 2012

Curation縱橫多媒體內容匯流互動展現

author: Grace 本文刊登於2012/08 ET電子技術(no. 317) (歡迎轉載,請著名出處)

關鍵字: 鉅量資料、黏著度、眼球追蹤計算、廣告代理設計、數據元標籤、內容匯流、數位策展、浮水印應用、指紋辨識應用

本文從MIC彙整的各國數位匯流政策與尼爾森收視統計開始,討論社群內容聚合與內容關注量測,引入2012年3月歐巴馬政府宣告2億美元計畫巨量資料「Big Data」計算計劃的國際數位策展(digital curation)互動速現法發展,以及推廣拓展至線上標籤技術拓展與影音內容同步技術。
interactive Ad 互動廣告服務
匯流發展趨勢
    據2012年1月到3月MIC彙整的各國數位匯流政策,可觀察到英國的Neul新創公司與日本各別開始設計空白頻段(white space)系統的共通規範,也就是說頻寬使用已超載;且根據中研院調查研究中心提供的12歲以上於100年7月至8月間上網情況,發現上網家戶數達到82.5%且上網人口數亦衝高至72%;加上尼爾森(Nielsen)每月統計發現,手機頁面2012年三月的每月觀看次數已達2億次,相較於2011/12的月觀看六千萬次,成長率顯著提升近三倍,線上品牌排名依序為Google、Facebook(臉書)、MSN、Youtube與Microsoft,此外,尼爾森還提供混合參觀人次與每人觀看花費時間的黏著度(stickiest)研究數據,Google平均每月有32人次參觀且達到87%的人次花2小時的時間在觀看google提供的資料,但臉書用戶甚至平均每月接近八小時的關注,若到了三月美國運動旺季Yahoo! Sports瀏覽人數也會上升至三千五百萬,超過ESPN運動台;由以上統計數據可發現結合運動時事社群媒體仍然具備有強勁的吸引成效。

    發現許多內容創意產業因應這股不能回頭的數位洪流而生,包含創作文本、遊戲、動畫、影視製作等等,更活絡不同領域間的技術交流與協同應用,引爆數種型態之視訊服務:端對端完整建製的數位廣播(雙向)服務開始擴展;營運封閉型網路IPTV電視服務之VoD/MoD(Video/Media on Demand)伺服器平台;運營商僅擁有信號源集中端設備或App程式的OTT(Over-The-Top)TV網路視訊服務,其優點為容易附著於STB(機上盒)與電視機兩大終端裝置,透過服務引進影音與社群網站資訊(如:網樂通、Apple TV、Netgem);經營開放式網頁型視訊服務(如:BBC或CNN),如圖1。
到底這些內容有多少人關注?
    各種內容觀看的計算法,從統計用戶眼球觀看率的PPV(Pay per view), CPV(Cost per view),到用戶觸動點閱的統計CPC(Cost per Click)和PPC(Pay per Click)的量測工具也因應而生,還有分析網路使用者觀看廣告放置網頁位置的眼球追蹤計算(eye-tracking methodology),由於不同來源網路的數位內容越來越多,2012年三月美歐巴馬政府宣告2億美元計畫,是處理巨量資料計算(big data computing)研究,分析蓬勃發展之多樣化來源的數位數據,用來展示科學發現、教育策略、潛在營利創造或創建社會科學預測,如圖2所示,要搭建整個互動式TV廣告服務需要眾多內容的整併,紫色框的廣告代理(advertising agent)轉變成與各種服務商、內容、用戶間的匯集所,數位檔案化變成一個不可逆的趨勢,以下則介紹要怎麼聚合數位內容的呈現法。

匯流內容統計測量方法
    領導與訓練數據接取(data access)、策展(curation)和社會科學研究社群(social science research community)分析法的權威機構 - 美國校際社會科學數據共享聯盟(Inter-University Consortium for Political and Social Research, 簡稱ICPSR),ICPSR成立於1962年的位於密西根大學安娜堡分校(Ann Arbor, University of Michigan, 1817-),此國際聯盟包括將近七百個學術機構和研究組織,且維護超過50萬個社會科學數據研究檔案,分成教育、老化、刑事審判、藥物濫用、恐怖主義與其他領域等16種專門集合,ICPSR目前正朝數據管理、計畫與探索新興數位策展(Digital Curation)幾個方向,為整個數位策展概述(Data Curation Profile,簡稱DCP)提供資源。
圖3顯示這個數位策展(digital curation)活動,便是數據發現與檢索,維護其品質、增加價值,並隨時間推移提供再利用,此新領域包含驗證、歸檔、管理、保護、檢索和呈現。
curation activities 測展活動與擴展
DCP數據策展概述
    DCP數據策展概述(datacurationprofiles.org)是由普渡(Purdue)大學圖書館和伊利諾(illionis)大學厄巴納-香檳分校的圖書資訊科學研究所的研究專案所產生,由2007年開始至今,其目標是了解為何願意分享資料,分享契機於何時發生、分享對象,和基於什麼條件,基於此專案之成果,發展了數據策展概述工具箱(Toolkit),此Toolkit可幫助開啟館員與系所間的討論,且幫助數據規劃服務,可直接標示研究人員的需求。這個DCP本質上使用一個”故事”的數據組(data set)或蒐集,描述其原樣與延展的生命週期,包含兩種數據組,其一是數據組本身目前之生命週期、目標、型態和感知值(perceived value);另一種數據組則涉及研究員的需求,包含數據如何獲取且何時數據需要被他人存取,需要什麼文件和描述的數據。此DCP概述和其關聯的Toolkit,藉由調查增長學術交流,特別是研究員關注汲取數據,是超越過去想像的上游(upstream)不斷變化的資訊,分成三階段準備、訪談到完成並分享個人化概述所架構的DCP,如圖4,因此DCP能做到:
  • 提供研究員討論數據的指引
  • 洞察數據管理之關注領域
  • 幫助評估相關資料蒐集的訊息需求
  • 察覺各種領域的數據間差異
  • 助於鑑別數種可能的數據服務
  • 建立檔案與保存之策展數據組之起始點
DCP stages
描述合適的DCP展現方式後,這個巨量資料計算處理的方法,經過資料簡化的標籤(tagging)法的濃縮,以及影音同步應用技術,可展現出更多匯流的新樣貌。

標籤型態介紹
    標籤的功能通常用於表示類別處理、標示擁有者、邊界註解與線上識別指示這些方面,其型態可以是文字、影像或其他識別印記,因此電腦為主的搜尋系統便可使用關鍵字,透過線上、網際網路資料庫與早期網站,去查找相關的內容,2003的社群書籤(bookmark)網站De.licio.us便提供用戶增加自己的書籤功能,且照片網站Flickr讓使用者可以增加標籤到照片內,因此這些機動加上容易查找的數據元(matadate)便提高這些自製內容與圖片的可搜尋性,這種傳統直接標示概念加上他種社群模式也成功的展現於youtube與Gmail等應用服務,另外還延伸些特定形式的標籤法:
  • 容器標籤(container tags):為重複元素標記,如:附上其他內容的開始和結束標記,舉例來說:此標籤可採用粗體斜體表示封閉內容的方法,用來顯示該標示內部對象的開始和結束。對容器標籤本身而言,是不顯示或產生任何輸出。
  • 三重標籤(Triple tags):也可稱為機器標籤(Machine tags),使用特殊句法定義額外語意(semantic)資訊,使其透過電腦程式產生更容易或更多有意義的解釋,讓未來在整理上會比較簡單,這個三重標籤含命名空間(namespace)、術語(predicate)與數值(value)三部份;例如:flickr的機器標籤功能,其處理分成兩層面,在使用者介面的支援,於標籤區多了一個機器標籤的區域,另一層面則是在API上面與以支援。
  • 複數標籤(Hash tags):短訊息服務,如:Twitter可包含一個或多個hashtags,於字首顯示井字號(#),且允許多個單字串,其優點是開發者可設計這個#字號做搜尋,且搜尋結果之呈現也納入此”#”標示字。
  • 嵌入標示(embedded tags):網頁和HTML電子郵件可能含有一個小的程式碼片段,稱之為網路beacon,其beacon最簡單的形式透過HTTP便讓網站,透過圖形影像要求而傳輸或蒐集資訊。網站可使用網路beacon和cookie進行諸多用途,包括網站使用之分析、廣告稽核與報告,以及內容與廣告的個人化。
經過標記之後的媒體內容,其運用方式為透過這些標記的搜尋、重製,可配合新聞、或新事件觸發,搭配打撈萃取成為新的有意義資訊。

影音同步應用技術介紹
    介紹兩種商業上常用的影音同步技術,當前最佳的應用就是火紅的第二螢幕(2nd screen),其與主要螢幕(TV)間的銜接溝通之同步技術:其中可透過追蹤各別資產的watermarking浮水印影音技術,去辨識內容創作者與權利管理;另一種fingerprinting指紋技術,是應用於廣播與通用媒體觀測(或稱為收視率調查)、版權控管、數據元(matadata)追蹤、行為模組廣告、複製保護與取證。
watermark vs. fingerprint
    參考表1兩種不同的影音同步技術比較,可發現數位聲音與視訊的watermarking浮水印技術,可視的部份可應用於嚇阻防盜的目的,不可視的部份通常用於取證的目的,且應用於廣播配送監測敏感資料上,如:預覽奧斯卡的最新影片,常用於測量數位電影院的反盜版措施與驅動內容識別,目前實際浮水印商業技術方面,提供額外的安全機制提供PayTV做優質內容配送,且增強用戶收聽廣播radio、觀賞TV與catch-up TV收視調查的精準度。

    相對於watermarking浮水印技術,此fingerprinting指紋辨識技術,又稱為SoundPrint聽聲辨識,其不需要產生可視的檔案,但是需要記錄微小的指紋辨識文件,擷取媒體的特徵(如:影像識別、或聲音辨識...),此為指紋辨識技術的關鍵意義,也就是它擁有獨特的解析度與格式,可用於識別完整的影視資料,還可以操作視頻混搭的內容操控應用,參考圖5,典型的商業應用為IntoNow的SoundPrint,使用者不需要輸入或選擇正在觀看的節目,僅需要手上的2nd screen智慧型裝置聽數秒,便會主動替用戶找到正在觀看的節目,或延伸帶出更多元的應用。
後記
本文從介紹目前市面上的匯流發展趨勢開始,討論用戶觀看內容的黏著度量測記算,代出各種數位互動內容的展現方式digital curation與profile toolkit,在介紹數種延伸的標籤技術,最後帶出影音同步商業技術進展,藉由多元化的陳述,希望帶給大家新型態的匯流內容方式。        (本文作者任職於資策會智慧網通系統研究所)

沒有留言: