What have you found for these years?

2011-11-21

ACML 2011

首先很感謝公司提供經費讓我跟↖潔牙ㄟ☆蕾絲↘參加 ACML 2011,
應該算是一次滿有趣的經驗吧,雖然可能沒有太多跟 machine learning
有關的心得.. 因為我對這門幾乎是一無所知,就算是講淺顯得我都聽得懂,
如果不多複習,寫點小程式驗證一下,大概沒過多久就會忘記了。

事實上是我也確實差不多忘記了... anyway, 總之還記得什麼有用的就大概寫一下。

這篇拖好久,一直找不到好時間寫... 結果我看一些細節大概都忘記了吧 :(
以下是第一天搭車時,在 iPod 上寫的。說真的,在 iPod 上打字比我想像中
容易許多,其實真的沒有打很慢。當然不能跟實體鍵盤比,但絕對比我在
我現在這隻 "google" (motorola) 的手機快太多倍了...

啊中文大概除外吧,我字根本都忘記怎麼寫了,手寫輸入實在太折磨我了 =_=
下面那個中「壢」我不知道試寫了多少次,才找到正確的字在哪...
其實我覺得這也滿妙的,字都不會寫,但有沒有寫錯卻看得出來。
或許跟看畫與畫畫之間的關係類似吧...?

Wrote on my iPod. (2011-11-13)

I only slept about 4 hours on Saturday, so I slept at 23 yesterday because I
was so tired and I needed to get up at about 7 on Sunday. Unfortunately, I
slept pretty badly, waking up all the time, and I decided to get up at about 5
because I can no longer fall asleep. Eating breakfast, replying emails,
watching a video, then I went out at exactly 07:30 as planned. (that's so
rarely) I arrived Taipei Main Station at about 07:45 and took the train at
07:47 which is very lucky. Hope I can arrive on time.

At 08:35 I got 中壢 station, it's several minutes faster than several years
ago. Maybe about ten, I am not sure. At first I want to take a taxi, but then
I noticed there's shuttle bus to ACML from the station. The one at 08:30
was already left, but I can still take the 09:00 one. To save me some money,
I decided to wait and take the shuttle in spite of the conference might start
from 09:00 and I would be definitely late if I take the shuttle at 09:00.

It seems there are only two people including me waiting for this shuttle.

- - - 回到 2011-11-21

我本來打算在一些比較聽不下去的 session 中,或是在宿舍裡,寫完每一場的心得。
不過在 session 裡有點難以專心,在宿舍裡只很累想睡覺... 或是都在聊天 XD
最後就變成什麼都沒寫了。

既然細節都已經忘得差不多了,那我大概就只提重點就好了。

對我來說,比較聽得懂,而且不會太悶的場子大概有三場。

11-13 的 Tutorial 1 (Prof. Wee Sun Lee)
Learning from Graph Data: Graph Kernels, Graph Mining and Recent Developments

11-13 的 Invited Talk 1 (Prof. Oren Ezioni)
Open Information Extraction at Web Scale

11-14 的 Invited Talk 2 (Prof. Yann LeCon)
Learning Feature Hierarchies

第一場不愧為 tutorial, 講解得比起其他場都要來得詳細許多。至於 Tutorial 2 的話,
只能說因為有點悶,所以我的老毛病又發作了,就不斷打瞌睡,沒聽到什麼.......
說真的,我對於我打瞌睡這個老毛病感到絕望了。就算是很想聽的,我也需要
一直強迫自己保持清醒。稍微悶一點,或是聽不懂的話,兩三下就開始神遊然後
開始打瞌睡...

真要說的話,搞不好 ACML 2011 全部裡面我有 10%~20% 的時間都在打瞌睡。
我還為此買了 airwaves 想咀嚼這個會不會比較清醒點?結果幫助似乎有限,而且
一開始我還忘記我有買,忘記拿出來嚼...

除了 invited talk 外,每個 session 都很難懂,因為他們的時間都很短,沒辦法
仔細說明,而且都講得很快,加上有些人的英文實在是很難懂... 或是有的人明顯
非常緊張,不容易理解對方想表達的是什麼。

能聽到各種口音的英文也滿有趣的。新加坡、香港、日本、還有歐系的。不要去聽
他們說什麼,專注在語調上的話,感覺真的可以聽出來對方的母語是什麼。可惜那些
語言也不熟,所以我大概也只能推測而已。

*

Learning from Graph Data: Graph Kernels, Graph Mining and Recent Developments
這場一直讓我感覺像在做 path finding, 有些方面而言跟 A* 感覺有點像,有各種評分的方式,
甚至還需要假設 input 是不準確的。

想想,確實很多問題是可以轉換成 path finding 的問題沒錯。印象提到最多的是
Markov decision process 和各種變形。說真的很想試著寫些練習啊,不過總覺得
找不太到機會,覺得最近可用的時間很少,雖然大部份還是用在發呆上發掉了。

*

Open Information Extraction at Web Scale 這場記得是講得很淺,很容易懂,
但因為很多細節都跳過了,變得比較像是欣賞講者想要表達什麼。大抵上應該算是
NLP 的東西吧,我想。後面有許多 demo, 例如餐廳的 comment 分類等等。

*

Learning Feature Hierarchies 這場感覺像是在講 computer vision, 一層一層
(thus hierarchies) 分析輸入的影像,分析出各種不同的 feature, 例如色系、材質等等。
這場非常精彩,可能因為是 computer vision, 有非常多圖片和動畫可以 demo,
還有很多影片,展示他學生成功做起來的一台機器,看起來真的非常厲害... 完全不會
撞到東西,就算忽然間跳到他眼前擋住他也是,立刻會轉方向。

也因此其實並不完全是 computer vision, 其中一台機器還有裝 GPS, 自動繪製地圖,
並不只是靠視覺去判斷路徑。

還有其中一台滿有趣的,大抵上都可以避開障礙,可是如果碰到太陽就破功了,
因為太陽太亮了,整個畫面變成白色就好像所有地方都沒有障礙 XD 變得有向光性......
不過既然太陽照得過來,那邊應該多少有路可以走倒是。

最有趣的應該還是最後的現場 demo. 他有一塊板子,接到一個 camera, 並輸出影像
到電腦上,還有個 console 可以用。拿這個 camera 拍杯子,然後在 console 上輸入
一個關鍵字,例如 c, 即可記住這是 cup 的樣子。下次有偵測到這樣東西的話,
會自動顯示出來。多學習幾次後,辨識率真的是很高!

另一個則是他拿這 camera 掃過整個會場,分別標 a, b, c, d, e, f, ...
然後掃回來時,可以判斷出確實是照 f, e, d, c, b, a 的順序。我覺得神奇的地方在於,
整個會場就是一堆人頭而已,說真的我看不出有什麼特徵可言。當然真要說的話,
人頭的位置是一種特徵啦... 只是這樣 online training 居然這麼有效,實在沒想過 XD

*

以上所有的 demo 照理說大概都是 open source 的?不過我沒有特別記住... :(
現在只想得到 EBLearn, 但我不確定這是不是他們團隊做的東西。最想要玩的還是
上面提到的板子和 camera XD 可能晚點再查查看資料,看看哪裡可以找到。

可能翻翻看 proceedings 裡面有沒有吧

*

整體來說,比較不滿意的部分大概是會場內常常有蒼蠅.... 而且這些蒼蠅很煩,
很難趕走,很常停到水杯上面。其中一隻更神奇,停在椅子上,晃到椅子都趕不走...
後來有人走過去撞到椅子,才飛走的。我一度懷疑我看錯,那其實不是蒼蠅,或是
他早就死在那了。

另一個則是桌子實在太不穩了,有人打字整個桌子就會晃....
還有到處都是布簾,桌子椅子都是,又都很長,很容易拌到或是踩到。

中央的宿舍以這價錢而言還算不錯,不過實在很吵,也不知道那些在吵的人是講哪國話。
還有原本以為是 ACML 贈送的杯子,結果是中央大學的杯子,然後宿舍裡有一大堆,
瞬間感覺狂降 XDD 這點還滿好笑的。

*

人的部分,我一向不是很喜歡攀談的人,再加上對 machine learning 幾乎一竅不通,
所以就沒有找人說話了。不過倒是意外碰到 google china 的人,算是有稍微聊了一下,
還把明信片發出去了 XDD

怎麼說,感覺跟我想像的有一點差距啊。之前在 rubyconf, yugui 很多問題都說是
confidential (而且是很普通的問題喔... 例如 google 內部有用 ruby 嗎?), 我還以為
google 其實很保守...。但這位覺得 google 很開放,也確實願意跟我們說不少有關
google 內部的事情。我想畢竟 google 這麼大,不同地方會有不同的狀況,
大概也是很正常的吧?

雖然其實也沒什麼特別的,但還是不要在這裡寫出來好了,
畢竟搞不好真的是 confidential? XDD

他講的是 Session 7 中的
Summarization of Yes/No Questions Using a Feature Function Model
在這裡道歉因為接近尾聲了,很累,所以聽完開頭我又開始打瞌睡,後面沒聽到 orz...

*

最後最後,提一下我對於 machine learning 的整體心得。
簡單地說,這是一個非常非常大的領域,裡面有一大堆子項目,
不同子項目有些差得還滿遠的。有些我覺得還滿有趣的,例如
path finding? 但有些我覺得實在有點,怎麼說,有某種很
不牢靠的感覺。也就是 heuristic 的部分...

有點像是隨便試一個參數,不對,就換一個,憑感覺換到對為止。
我覺得這樣還滿無趣的,因為根本不知道為什麼這樣是對的,
也不知道到底要試什麼東西。

也就是說,相較 machine learning,
我想我還是比較喜歡 programming language 吧。

不過這樣說起來,說不定 machine learning 比較像科學,
而 programming language 比較像數學... 偏偏我根本不大懂數學 XD

0 retries:

Post a Comment

All texts are licensed under CC Attribution 3.0