相信這幾天有看我網站的人都發現了一件怪事,有一篇被不少網友 TAG 起來的文章莫名其妙的消失了,現在就將我所有整理的內容與大家報告, Blogger.com 背後到底做了些什麼事情是我感到有疑問的。但是在真相大白之前,希望各位也別窮猜或是在自己 Blog 上發文幹譙了。沒有任何真正答案之前,暫時我還不希望這真的是言論限制的開始(台灣應該不在範圍內吧?),我還是願意相信這可能是系統有某種背後的原因或臭蟲,然後我還想多實驗幾種不同的組合,這才符合本館精神,如果找出個 BUG 也是美事一樁啊!XD
我在2月7日凌晨時間,一口氣發了兩篇文章,分別是:「Google is not China people's Friend, But It lets other countries' people get more Chat.」與「Google 的十條「黃金條律」要就此更改(Google needs to change its "Ten Golden Rules" to keep Google's Credibility in US): Don't be Evil, but do in China」(標題太長,底下簡稱「G文」,免得我被認為是在騙 PAGERANK ),然後就安心睡去。到了2月9日,我發現兩個非常有趣的影片,我就上線來發表文章,我不是一個往自己家網站跑很勤的人,中間空隔的兩天我都各只有上來一兩次,網站文章表面看起來一切正常,所以我就用很快的速度發表了 InterNet for Porn 的趣味影片與 SMAP SHORT FILMS 中被網友節錄出來丟在 Google Video 上的影片,隨即離線。但是這時候其實「G文」已經從資料庫中悄悄的被移除,所以重新發佈網頁之後,文章就直接在網站上蒸發掉。而這時候應該有幾位網友以為我是自行移除的。神不知鬼不覺,系統沒有任何的通知或是紀錄。
在2月10日我發表另外兩篇文章的時候我發現了這件事情,因為我有設定備份文章(只要發文章就會自動寄一份備份到我的 Gmail 信箱中),所以我把文章翻出來,準備重新 POST 一次。
2月12日晚上,我先把原本的「G文」發佈出來後,緊接著發佈後面兩篇文章「Michael Forever」與「手動增添 Link to this post功能」兩篇文章。但是第一次發佈「G文」時,我的動作太快,把標題放在「連結」的欄位,而非「標題」的欄位就發佈出去了,所以首頁文章是沒有大標題的,我重新進入後台修改。過了兩個鐘頭我重新看後台的文章列表,發現「G文」的狀態被 Rollback (回溯)到「標題錯置於連結欄位」的狀態(開始好玩了!),因為這時首頁是靜態網頁,所以文章的標題還是正確的出現的。我在發佈首頁的時候,文章標題變更,所以連帶檔名也會變更,一位網友要留言則發現原文章連結已經被移除,而產生錯誤訊息,所以在小留言版上留下記錄(可以看一下時間,因為小留言版是日文的,所以時間差一個鐘頭)
所以我又再次進入修改,把「G文」的文章標題改回來。這時候又恰巧有兩位網友進來留言,其中一位正巧是「龜趣來嘻」的 blogger portnoy(可以參照一下圖片的時間)。沒多久,文章再次被 Rollback,但是留言的文章並沒有因此回溯或消失,所以我又再次修改標題的位置,重新發佈,確定正確後出門一段時間,回來的時候就發現文章又又又再次被回溯,因為這時候網站還沒有重新發佈,所以靜態的頁面還在,只是也沒有辦法繼續留言,所以我手動把文章砍了,準備開始做實驗, portnoy 就不要氣了,系統沒砍,只是「回溯」,為何這樣說呢?請看吧!好了!問題在哪裡?開始實驗吧!
因為文章已經兩次從資料庫中消失,我開始做實驗囉!我把文章發佈到 Meta-backup 那個網站去,那個網站也是以往 Metamuse 的文章備份區,然後再發一篇到現在的 Metamuse ,但是使用的是不同的標題,這時候故意更換成英文:
Google needs to change its' "Ten Golden Rules" to keep Google's Credibility in US?: Don't be Evil, but in China?(A標題)
然後再修改成:
Google 的十條「黃金條律」要就此更改(Google needs to change its' "Ten Golden Rules" to keep Google's Credit in US?): Don't be Evil, but in China?
這個原文的原來標題(底下簡稱「G文原標題」),沒多久系統就自動會把文章往前「回溯」到 A 標題的狀態。(補註:就是在這個時候加上問號,試圖軟化語氣看是不是此問題)
我重複修改文章題目變成:
Google 的十條「黃金真理」要就此更改?:Don't be Evil, but in China?」(B標題)
然後再修改一次題目變回「G文原標題」,可是系統過沒多久又把文章往前回溯成 B 標題的狀態。
怎麼知道是用回溯的呢?我就再一次把文章標題打成 B 標題,同時修改文章內容,然後,再一次的更改為 G 標題,也同時修改文章內容,結果發現回到修改為 B 標題的狀態。既然是回溯,我回頭看看 Meta-Backup 的狀態,文章當然是回溯到「沒有文章的情況」。
是因為內容被系統偵測到而被移除的嗎?一位網友使用了 Link to this post 的功能同步摘取了正確的 G 文與標題,但是沒有內容,立即就從資料庫消失不見,只剩下靜態網頁。她(女性,別懷疑)不死心,再一次摘錄,因為原本的標題 its' 應該為 its ,所以他做了些微的修改,而 「'」這個符號在HTML中也有標記的作用,所以更改掉似乎也是比較好的。
Link to this post 摘錄的標題有多長?這麼長!!
「羊男實驗的咖啡館之METAMUSE : Google 的十條「黃金條律」要就此更改(Google needs to change its "Ten Golden Rules" to keep Google's Credit in US?): Don't be Evil, but in China?」
不用 10 分鐘,立即從資料庫中消失不見。百試不厭! LOL
(YA,原來這時候就應該要知道答案的)
開始有人注意到這個問題了嗎?
這篇文章的 TITLE 可以確定已經遭到系統鎖定(Lock)了,不是因為中英文夾雜而發生系統衝突的問題,也不是系統本身的發佈系統哪裡出錯,而是這個標題已經被 Lock 了(因為過長),只要有人使用這個 G 文的標題,不管內文是什麼(引用、轉摘、加更多文字等等),就立即遭到系統自動「回溯」到前一個狀態,如果回溯的前一個狀態是沒有這篇文章的,文章就自動從資料庫中消失不見,為什麼遭到鎖定呢?一開始我懷疑是 Google 的名稱出現太多次,而遭到系統誤認我再賺取 Pagerank,但是同樣的文字我重複輸入再重新發佈,一點事情也沒有,我試過新的排列組合,一樣是中英夾雜,裡面有很多的類似的關鍵字,也沒有問題,發佈的檔案名稱重複,也沒問題,但是只要標題中出現完整的、我所立下的標題,文章就會「噗」一聲,立即消失,害怕了吧?
即使我發兩篇文章將「G文」的時間壓過去,抱歉,依然只有「G文」該篇文章會在資料庫中回溯,而不是整個網站的狀態回溯(因為更新的文章會留下來),如果回溯前沒有文章本體,當你發佈網站後,這篇文章就會神不知鬼不覺的被修改掉或是被移除掉(歸零囉!),這樣的方式真是夠帥的了!完全不會被察覺!尤其是像我這邊各站文章總和已經上千篇的,裡面只要有文章「不小心」不見、「不小心」回溯,重新發佈後完全不會察覺,因為沒有人會一篇一篇回去對整個目錄,看看自己寫過什麼、哪些不見了啊?如果這是一項內建的功能,那真是太厲害了!不過這到底是不是 BUG 呢?不可能吧?
問題在哪裡?(中英夾雜長標題)
這種 Lock、Aim、Destroy 三階段工作,交給發佈系統自行處理就好,只要有人在資料庫中設定好這個自動執行的 Script,發現完全 Match 的關鍵字,當下立即把文章回溯掉,不管誰發的。問題是:誰設定的?難道真的是系統內部有錯誤?我們錯怪了 Blogger.com ? YA,錯怪了!
我不知道。因為我連發信去問一下 Support 都懶了,因為那個標題說實在的,應該踩到「痛點」而被 Lock 了吧?但是有人願意出來說明一下應該更好,不過好像也沒有,因為對一個小小的網站他們似乎也沒有說明的必要。
經過一整天不斷的嘗試相信 Blogger.com 中不會有人沒注意到吧?但是卻可以發現刪文的速度越來越快了,簡直是系統在跟其他網友拼速度一樣。
話說回來,我的站也不能再算是小站了(很臭屁嗎?)(YA,有人以為你想出名。)
雖然我從未跟其他人交換連結,對別人也不加理睬,不曾主動在其他地方留下本站的連結,對一些小白們也從不客氣,也就是說我既不行銷自己的網站,也不跟其他人在這片網海套關係、打交道,更不接受其他媒體的採訪,我只想找個好地方默默的做我自己的紀錄。在這種個人要求的情況之下, Metamuse 的 PageRank 還是一度上升到 5(現在是 4 ),Bloglines 中也是有不少的網友訂閱,去年來觀看的人數與點閱率在 Atom 訂閱愛開不開的情況下,也達到一個不算少的數字,非常感謝這一些默默觀看與連結的網友。
當前幾天我第一次搜尋「Google的十條黃金」這個關鍵詞,在搜尋結果中,網站排名已經站上所有中文網的第一頁下半部,其他都是簡體文網頁,會被 Lock 似乎也沒那麼稀奇。(YA,他們的確不理你。你多想了。你在臭屁又自吹自擂。XD)
現在該怎麼辦?
跟某網友Y小姐說到此事,她的回覆是:「最好你的網站有這麼多人看而被上頭關注啦!」好像也沒批評錯,真要說大,我的網站也沒如此大啊!(YA,你說對了!)
幾位網友開始加入實驗,發現事實正如我所看到的,只要標題一模一樣(長),就會從資料庫中憑空消失,如果依照我的實驗,頂多是回溯而已,資料庫本身的保護機制還是人為的問題呢?我不知道要怎麼解釋。(YA,「資料庫的保護機制」這個答案應該是成立的。)
如果換個標題,可以騙過系統,但是可以保留原本的文章,那就換吧!反正只要該篇新標題的文章所擁有的反向連結,如果不斷的再次衝高, PageRank 一樣是很高的,接下來就看這篇改成新標題的文章,會不會再度消失、再度被 Lock、Aim & Destroy 了!如果會,我大概就得考慮搬家嚕!
--------------------------------------------
補註:現在原文標題文章名稱更改為:
Google 的十條「黃金條律」要就此更改(Google needs to change its "Ten Golden Rules" to keep Google's Credibility in US): Don't be Evil, but do in China
我後來又開始思考一個問題,系統鎖定的應該是文章所生成的檔名,才會如此精準,而檔名是依照標題文字來產生的,像是原標題文章所生成的檔名,不管是在哪個 blog 都一定是:
google-google-needs-to-change-its-ten.html
這個檔名,然後只要這個檔名一出現,就被回報到系統,然後執行資料庫回溯的動作,而一般這個檔名也是 Google 搜尋引擎在搜尋網路文章時,一個很重要的依據,避開這個檔名的排列組合,會不會就有機會保有文章咧?等等來試試看!:P
好吧,上面的假設我錯了 Orz,標題就算改成 "Don't be Evil, Except in China...."開頭,或是 "Don't be Evil, but do in China...."開頭,來取得不同的檔名,一樣會回溯。
-------------------------------------------------------
基於另外兩個標題與內文、留言都沒事,我還是願意相信 GOOGLE 並沒有在監控言論這件事情。但是為何那個並沒有過長的標題無論如何都會消失?我真的沒有答案。
在真相大白之前,希望各位也別窮猜或是發文幹譙了。如果到時候只是一個基於天時地利人合的大BUG被我的賤手碰上了,那就好笑了。LOL
不要引起不必要的騷動吧?不過 dont be evil, except in china 那篇也被刪除,這點就很怪了,到底回溯的機制是什麼?一陣迷團啊~~~。
-------------------------------------------------------
02/14 20:06
經過一天一夜的測試,這應該是個 BUG ,竟然在一個敏感話題上被我遇到了,我認栽。系統鎖定中文過長的標題,來做系統回溯的工作,所以 Blogger.com 是無辜的,因為 Blogspot.com 早已被踢在防火長城之外,所以 Blogger.com 是沒有錯的。
這只是個 Bug 或系統自保的機制!!而我是第一個遇到!!
Blogger.com 我對不起你~讓你的資料庫系統莫名其妙忙了一整天!!
各位網友對不起,造成各位的誤解了, Blogger.com 是無辜的。
請不要再 follow 這個議題了。
不過知道有可能是 Bug 或系統自保的機制之後,似乎有一種鬆一口氣的感覺...
不用搬家了,Links to this post 的功能似乎還真的蠻不錯用的...V_V
(底下留言功能關閉)
(底下 Links to this post 功能關閉)

13 comments:
「如果你對Blogger有所不滿,你所能做就是改變自己,
或是封起耳朵、閉上眼睛,孤獨的一個人活著,
不然就是...」素子拿著左輪指著其他BSP說著。
Just kidding :p
真沒想到 Google 真的會做這種事 @_@
這也有好處啦!這樣至少知道 Blogger.com 背後的機制是「電腦會選文喔」!
我還是覺得滿怪的,雖然你,P 還有其他人遭受到同樣的問題,但是在我的blogger 上是ok 的。
不過我懷疑blogger.com 最近有問題因為常常沒辦法連上他的首頁。
改了標題的文章我也會再發一次,觀察看看。
我曾經懷疑過我手賤,真的不小心誤觸資料庫地雷,所以我試過把引號「"」拿掉(GOOGLE 引擎不比對引號,但是資料庫可能很敏感),略微縮短幾個字(但是原標題依然沒有到達資料庫欄位的長度上限),更改幾個字(例如「黃金條律」改成「黃金真理」)但是主要標題意思不變,依然遭到移除。
我還是願意相信GOOGLE,所以我改了文章標題、順序、用詞、把「BUT DO」換成「EXCEPT」、引號拿掉等許多方法,都會被回溯。也就是說初期是人為,後來是機器為之。
但是拆開來三句互相組合成:
Google 的十條「黃金真理」要就此更改:Don't be Evil, but in China
或是
Google needs to change its "Ten Golden Rules" to keep Google's Credibility in US: Don't be Evil, but in China.
則沒有問題,這樣看來像是標題過長的問題囉?所以我有試打更長的標題:
Google needs to change its' "Ten Golden Rules" to keep Google's Credit in US?: Don't be Evil, but in China? (Dont try to do something on my article!)
竟然沒事(所以不是標題長度的問題)!這就說明了機器笨笨的在執行比對工作。一直到第二天我修改回原標題,又回溯了!
我把同樣的標題完全打亂,然後 POST 出去,但是取得的網址是跟之前一樣的。結果文章被系統立即刪除。
第二次我把標題完全打亂,然後取得不一樣的網址,結果也是被系統立即刪除!
所以檔名沒問題,問題在標題所用的文字。
同樣的字元(包含空白)但是是完全混亂的排序,也是成功發出後,資料庫的內文被刪除掉。這像是系統比對關鍵字後將文章回溯,因為大家應該都知道 GOOGLE 的關鍵字比對技術是每個字分開來比對的。
我已經完全搞不清楚。
是有人設定完、讓後台笨笨的比對字元後回溯,還是這幾個字的組合,真的誤觸資料庫地雷?(不會吧?)所以我又把所有可能會影響到資料庫系統的符號拿掉,只剩文字的標題發出,一樣不見了!XD
如果說這種是 BUG ,不但需要天時地利人合,各方條件(位元、在固定範圍內變動的標題長度)都得恰到好處的資料庫欄位地雷,剛剛好被我碰上,那我要去簽樂透了!@_@
所以試試看底下這個標題一直無法存在的標題吧:
Google 的十條「黃金條律」要就此更改(Google needs to change its "Ten Golden Rules" to keep Google's Credibility in US): Don't be Evil, but in China.
基於另外兩個標題都沒事,我還是願意相信GOOGLE並沒有在監控言論這件事情。但是為何那個沒有過長的標題無論如何都會消失?我真的沒有答案。
在真相大白之前,希望各位也別窮猜了。如果到時候只是一個天時地利人合的大BUG,那就更好玩了。不要引起不必要的騷動吧?
muser:
以如你所說改成以下標題:
Google 的十條「黃金條律」要就此更改(Google needs to change its "Ten Golden Rules" to keep Google's Credibility in US): Don't be Evil, but in China.
因為這事情已經變成小小的串連,但是我個人認為在真正原因發現之前,就先假定google 幕後操作也不是很適當的做法。所以我願意做各方面的嘗試想知道這是單一事件還是真有其事。
不過有幾個地方不同的,就是那個blog 是一個全新的blog,沒有任何page rank,但是即使如此,照你推論的資料庫關鍵字問題,也應該一視同仁才是。
muser我也要一起玩G文 :D
或許...真的有觸碰到什麼不知名的規則吧~~要不然就是muser及各位大大的網站真的比較知名吧~~小弟對此事也是超級care的...所以用了同樣的標題和內容...但期待了一天還是沒有被移除....這~~這~~應該開心還是難過呢?????
我做了一點測試,從最後兩張圖(1, 2)看來,似乎是中文長標題的問題。
恭喜,又有一篇文章慘遭「斬立決」!
這篇也是馬上不見嗎? 要不要開個新帳號看看.?
還是真的與PageRank有關?
第一次感覺網路上的言論自由原來是假的@@a
恭喜,又有一篇文章慘遭「斬立決」
↑這篇也不見了。
今天中午吃飯時在三立新聞台...也將關於google在中國搜尋出不一樣結果做了一篇新聞報導...只是在餐廳的同事也僅是冷漠看待此事~~~無言....
另經wenli的提醒我有再重新發佈過整個blogger,呃~~文章還在哩!!!真是神奇....
『恭喜,又有一篇文章慘遭「斬立決」』
是我自己刪除的啦!
慘了,現在有風吹草動大家就開始懷疑東懷疑西的,這似乎可以針對「CORE VALUE的瓦解」來寫一個題目了...
New comments are not allowed.