2016年2月4日 星期四

大數據和量子電腦激盪出的火花

New quantum approach to big data

Massachusetts Institute of Technology

January 25, 2016

detail: essay, news

小至基因定序,大至太空探索,人類持續得製造許多的資訊和資料,多到連人類自己都無法hold住了。而,機器學習可以幫助學者們解決這方面的問題。 最有用的工具之一是由拓撲學衍生出來的分析軟體。簡單來說,拓樸學就是研究一定空間內點對點的連結狀況,甚至是那個空件被扭曲後的情形。

在處理複雜的網絡連結時,拓樸工具就顯得極其重要且有用,如:腦裡神經的連結、電力網路、網際網路的節點。但是,就算世界最強大的超級電腦碰到這精巧的演算法也沒轍。然而,麻省理工滑鐵盧大學南加大的研究員使用量子電腦來簡化進而解決這問題。

研究小組將他們的理論方法發布於 Nature Communications。第一作者 Seth Lloyd 和 機械工程的 Nam P. Suh 教授說明,代數拓樸將是解決之鑰。他們說,這個方法可以有效解決當人們在現實生活中蒐集資料時所造成的扭曲。在拓樸學的觀點裡,不管怎麼「扭曲」(distortion),整個資料系統還是一樣的,也正是因為這個特質,要重組資料成其應當表現的形式就更簡單。

他說,資料組(dataset)如何排列並不重要,拓樸學就是在研究資料的連結及洞(hole),不論是實體的洞或邏輯上的洞,拓樸學就是會找到。

如果使用傳統的電腦,這個方法將會因為一些多方的連結而過慢且極度昂貴,這個時候就是量子電腦介入的時候,這將可以指數型的增快速度。

Lloyd 給了個簡單明瞭的例子,如果一個資料集合有300個點,傳統電腦的方法將會需要 2^300 個運算單位,也就是說,宇宙級大小的電腦,理所當然的,這樣的方法絕對解決不了該問題。量子電腦就加上他們的運算法可以只用300個運算單位(processing unit)來解決這個問題。

這種運算法可以解決許多難解的問題,拿腦部神經元連結來說,腦電描記器核磁共振造影所蒐集到的資料連結就可以被解析進而了解我們思考的模式。這可以運用於世界的經濟、社群網路及其他需要用到廣泛連結的資訊,但是,以前的方法使這願景遲遲無法實現。但是,實驗學者已經聯絡我們並在進行該理論的原形,因為細觀各個量子電腦就是一個拓樸結構。
左邊是大腦表面上連結的情況,右邊則是依照被影響而繪出
顯然的,連結突然多很多,這也就是食用毒品後,聞到顏色的機制
Credit: Image courtesy of Massachusetts Institute of Technology