過去幾年間,大數據逐漸從一個熱門概念落地為可進行商業變現的具體業務。無論是互聯網公司還是傳統企業,都在迎接數據帶來的改變,媒體行業也不例外。
數據“入侵”,重識媒體
隨著移動互聯網的普及和大數據技術的發展,泰一數據發現數據技術與媒體的關系愈加緊密,在內容素材、創作參考、業務探索等方面,數據技術正在“擠占”媒體人的生存空間,其表現在于數據在數字技術與媒體融合的過程中扮演著越來越多的重要角色。
內容素材
作為內容素材的數據。在今天的技術環境下,媒體信息的表達不再局限于文字,數據作為一種信息組織形式,正在被越來越廣泛的用于傳遞信息。據對媒體人的調查顯示,95%媒體從業者認為數據對于新聞創作具有非常重要的作用。數據已不再是數據新聞團隊專屬的創作素材,對于普通記者來說,使用數據進行報道正在成為一種新聞操作習慣。
*數據作為內容素材
同時,如果能對數據進行進一步挖掘,通過數據的匯總和分析,個案之間的潛在關系被重新組織,從中也可能挖掘出另外的新聞發現,這是普通采訪所無法達到的。通過數據查看熱點、利用數據進行新聞線索挖掘逐漸成為常態。
【應用】
2016
年,《華盛頓郵報》開發的新聞撰寫機器人
Heliograf
正式上線。通過使用記者和編輯提前制作的敘事模板,其中包括各種潛在結果的關鍵詞句,比如,“共和黨人對眾議院的控制權”,“民主黨重新控制了眾議院”,
Heliograf
將這些內容與數據交換網站中的結構性數據源相聯系,并進行數據識別,與模板中的詞句匹配、整合,“編寫”新聞,同時根據不同的發布平臺提供不同版本的報道。
在國內,騰訊財經的機器人
Dreamwriter
、今日頭條的
Xiaomingbot
等寫稿機器人同樣能根據算法瞬時輸出分析和研判,在第一時間自動生成稿件并送達用戶。
創作參考
作為創作參考的數據。移動設備正在成為最重要的媒介載體之一。據中國互聯網信息中心
(CNNIC)
統計,截至
2017
年
6
月,中國手機網民規模已達
7.24
億,手機上網人群在網民中占比
96.3%
。基于電子媒介,人的閱讀行為已經被廣泛而準確地記錄,輿論變化和新聞熱點變化可以通過數據被更加細致地呈現。閱讀量、轉發率、二次傳播等數據已成為媒體量化傳播效果的重要參考指標。
【應用】
社交平臺Twitter上,一款叫做ReutresNews Tracer的工具被用來監測隨時出現的各類新聞事件、檢測社交媒體信息的真實性。其功能亮點是:能夠實時監測社交媒體上的新聞;用算法去問記者平時可能會問的問題,倒推新聞的真實性;通過算法和機器學習挑選出哪些是新聞,哪些是廣告、謠言或一般性對話,并摘出要點,同時把相同類別的新聞相疊,組成數據;給記者和編輯提供可靠的素材和資源。
*ReutresNews Tracer
業務探索
作為業務探索的數據。除了素材提供與創作參考,對新聞數據反饋的搜集分析即輿論業務也逐漸成為部分媒體的新業務內容。
截至目前,包括人民日報、新華社、南方報業等在內的國內媒體已經開始發展數據、輿情業務。其中,人民曰報社從
2008
年開始組建人民網輿情監測室(
2017
年更名為“人民網輿情數據中心”),南方報業集團于
2014
年成立南方輿情研究院,新華網網絡輿情監測分析中心于
2016
年開始推出信息超市平臺一一新華“云智”。
【應用】
人民網輿情數據中心已擁有個性化、垂直性監測功能的互聯網輿情監測系統,該系統基于網絡輿情傳播規律,及時、全面地監測境內外新聞網站、論壇、報刊、電視、廣播和知名博客、微博,并在此基礎上進行數據的抓取、挖掘、聚類、分析和研判,以實現網絡聲譽管理、輿情監測、敏感信息預警、內部風險管理評估、突發事件實時追蹤和宣傳工作評估考核等功能。
*人民網輿情數據中心
媒體巨變,進入“智媒時代”
先進的數據技術使全球的媒體生態都處于巨變之中,隨著媒體對宏觀數據、行業數據、地理數據、輿情數據、讀者/用戶數據等數據的掌握,使媒體生態在新聞生產系統、新聞分發平臺、用戶平臺、信息終端四個維度的生態均已經發生變化。其中,新聞生產系統的變革首當其沖,得益于未來數據的極大豐富、算法模型的升級及人工智能等創新應用,這些技術將直接推動內容生產由
UGC、MGC
進入更高的
IGC
發展階段。
在
UGC
(即用戶原創生產內容)階段,微博、微信、豆瓣等各類網站、
APP
上的任何用戶都可以生成原創內容,因此而產生了數量龐大但質量參差不齊的內容數據。隨后的
MGC
(即機器生產內容)階段,將大數據、計算機算法和人工智能等工具應用于內容生產,產生大量的優質內容,但目前而言,機器寫稿的質量及稿件的普適性依舊偏低,它們更適用于突發新聞事實的報道,但其后仍然需要專業的記者、編輯做深度挖掘和擴充。
直到進入
IGC
(即智能化內容生產)階段,機器在代替人類完成重復性、規范性寫作和客觀數據聚合類等工作的基礎上,通過語料、素材與數據的搜集處理與高效率加工等完成內容生成工作,內容生產者在此基礎上充分發揮人類的演繹、推理和聯想能力,從而完成更深層次的內容生產。
隨著數據技術“入侵”媒體,未來人機協作的趨勢已是必然,媒體的內容生產將更加智能、信息整理的效率更高、創作能力也將顯著提升,因此這種“入侵”未嘗不是好事。
【關于我們】泰一數據是泰一指尚(股票代碼:600070)旗下數據商業服務品牌,依托大數據技術實力及持續的產品創新,幫助客戶實現大數據分析與應用,建構數據價值發現和應用創新能力。