記得很久之前在課本上讀到過「專家不過是訓練有素的狗」,甚至國文課還要求要用這個概念來練習論說文。可讀完了《數據可視化之美》後,這才覺得那個「狗」不見得是消遣專家的用法,而是「狗」確實能看到不一樣的東西,這也是我對這本書的副標「通過專家的眼光洞察數據」的見解。那麼,專家的眼睛裡面到底看到了什麼?
原始數據對大多數的人來說並沒有意義。直接給你一堆日誌檔,或是給你一堆文字,甚至是給你一堆位元組,不要說是解釋內容,就連這堆數據是什麼都不知道。專家和我們的差別,在於「專家」能夠理解這堆看似密碼的數據,並且能夠發掘數據的潛力,甚至還能夠將其轉換成為一般人能夠看懂的內容。可視化(visualization),或是這邊常用的視覺化,是種簡化並且再構成數據的方法,也是種專門知識與大眾知識橋接的方式,經常被用來轉譯這些看似無意義的數據。
然而,視覺化到底能夠做到什麼樣的程度,很大的程度還得靠藝術思維來達成。《數據可視化之美》中介紹了許多個案,第三章的Wordle是讓我接觸這本書的關鍵。相信很多人都已經玩過Wordle,就算沒實際用過,facebook上也已經有許多相關的應用出現了。Wordle可以讓出現頻率高的詞彙更加凸顯,某些程度上幫你驗證你對於文本的認識。然而,另外印象最深刻的卻不是Wordle,而是第六章的「飛行模式」(flight patterns)。
Aaron Koblin的「飛行模式」將美國與加拿大民航機在24小時內的飛航軌跡呈現在螢幕上,而且不單單是靜態的路線圖,還包括了動態的飛行模式。這個視覺化的成果令我感到訝異!怎麼有人能夠想到這樣表示飛航路線!
Aaron Koblin簡單解釋了飛行模式的繪製,令我更驚訝的是,那個過程並不複雜。他用了Processing將數據視覺化,他表示「Processing是特別適合於數據可視化的一種編程語言」,經過簡單的試驗後,確實如此。
不單是「飛行模式」用了Processing,《紐約時報》也同樣應用Processing將其數據視覺化(見第15、16章)。原本我一直覺得運用程式來繪圖非常麻煩,只因為沒接觸過Processing。Processing所使用的是Java,只要你會Java,或是JavaScript,或是任何一種語言,應該非常容易上手。況且Processing有許多範例與現成的函式庫,隨便google也都能找到許多討論和解決方案。或許我也會開始慢慢移往Processing來處理我的視覺化需求。
解決了圖像化的困難後,再來就得有些創意了。我覺得在這個部分,藝術家仍舊走得比科學家快。畢竟藝術作品不見得要有實用的部份,可以天馬行空,也可以走得非常地超現實。我在TED上找到了Aaron Koblin的一場演講「人性的藝術表達」(Artfully visualizing our humanity),介紹了他近來製作的幾個專案,每一個都相當有意思。
這場演講中的每個專案,都可以從Aaron Koblin的網頁(http://www.aaronkoblin.com/)中看到。他的最後一張投影片寫著「THE INTERFACE IS THE MESSAGE」,並在結語中表示:
交互介面可以成為一種強大的敘述裝置。
隨著我們所收集的與個人和社會相關的數據越來越多,
我們就有機會,或甚至有一種責任,
通過共同的探索與合作,保持人性,
講述這些神奇的故事。
這種酷似麥庫魯漢的聲明,某種程度上延伸了麥庫魯漢的觀點,卻也為其加添了人文思維。Web 2.0強調的互動,與各式各樣的自動化機器人,在某個層面上可以透過這些人文的互動使其產生意義。
最後,我想小結一下《數據可視化之美》這本書。當然,所有的個案都是針對數據做視覺化的工作,但幾乎所有的個案都是「探索」數據的內容,而不是去驗證假設。這對一般社會科學研究所重視的假設驗證來說是不可取的,但隨著這些數據量越來越大,我們也不能忽略數據探索這個領域的發展,許多有趣的事正在這裡發生。另一個,該開始去玩玩Processing並想想各種視覺化的方式。雖然使用SAS與SPSS仍舊相當重要,可是它們所呈現的結果,也只有專家才看得懂。
如果你也有興趣,下面提供博客來的銷售資訊,歡迎大家一起來閱讀。
《數據可視化之美》
- 作者:[美]斯蒂爾(Steele,J.)等 編
- 譯者:祝洪凱 李妹芳
- 出版社:機械工業出版社
- 出版日期:2011年06月01日
- 語言:簡體中文 ISBN:9787111337966
- 裝訂:平裝
- 作者:Steele, Julie (EDT)/ Iliinsky, Noah (EDT)
- 出版社:Oreilly & Associates Inc
- 出版日期:2010年06月30日
- 語言:英文 ISBN:9781449379865
- 裝訂:平裝
留言
張貼留言