2009年8月18日 星期二

Oracle 騙很大,用 Oracle 的資訊主管就該死嗎?

用了 Oracle 騙很大,用 Oracle 的資訊主管就該死嗎?

從去年底開始,軟體公司為了救業績祭出殺手金間,有的不顧過往與客戶對於授權數量的協議,而要求企業限期內補足授權數量;有的不顧企業的營運壓力沉重,反而選在不景氣的時候調漲軟體維護合約價格。

2009 年5月我多家企業都收到Oracle軟體授權管理服務部門來函,要求企業限期補足資料庫的授權數量。收到通知的資訊主管都相當氣憤,他們指出,廠商為了把軟體賣給企業,一開始就允許企業不必買足授權數量,然而卻在此時打破這個默契,二話不說就寄來要求補齊授權的存證信函,使得資訊主管難以面對老闆的質問,甚至是信譽掃地。

軟體廠商瘋狂追補授權,企業開始反撲
企業面對一波又一波的軟體使用清查,如何釐清合法使用情況以及授權方式不合理等問題都浮上檯面。企業所質疑的,不只是軟體廠商背離誠信追補授權的表象,對於隱藏在這個表象後面的諸多不合理處,才是爭議所在

企業十分不滿廠商主宰軟體授權
總共有166 家企業回覆了本次的問卷調查,其中有126 家企業都透過文字寫出了軟體授權的不合理之處,無奈之情溢於言表

企業必須覺醒,尋找替代方案才能有籌碼
面對軟體廠商的不平等條約,企業必須覺醒,找尋其他替代方案的可能性,展現一種態度,增加談判籌碼

軟體授權只授予企業使用權,而非著作權
依照臺灣對著作權法的保障,企業若違反軟體授權合約,極易同時違反著作權法

軟體廠商的回應
針對126 位資訊主管提出的軟體授權與維護合約問題,提問9家大型軟體廠商

政府應立法讓軟體授權可轉移
企業對於軟體授權不合理之處,可以透過向公平交易委員會檢舉,對軟體廠商施壓,以爭取更合理的軟體授權方式

認清BSA如何執行查緝
當BSA 夥同檢察官與警察進行查緝工作時,要仔細看搜索票的執法範圍,並詳細確認執法人員清查的軟體種類與數量

降低軟體費用的四大策略
廠商查盜版,企業開始思考尋找替代方案

以資產管理軟體快速清查軟體使用狀況
透過資產管理軟體可以即時知道企業內部軟體的數目與種類

用Workflow串接工作流程節省軟體授權數量
連展科技以Workflow串接流量,降低企業使用軟體的授權數量,並達到稽核的效果

Oracle追補企業軟體授權

廠商狂追授權 企業群起控訴
http://www.ithome.com.tw/itadm/article.php?c=56462&s=1

http://www.ithome.com.tw/itadm/article.php?c=56461

2009年8月1日 星期六

戰國策爆發客戶資料外洩事件

戰國策爆發客戶資料外洩事件
http://www.ithome.com.tw/itadm/article.php?c=53022

戰國策資料全都露 用戶毫不知情
http://www.ithome.com.tw/itadm/article.php?c=53031

知名主機代管商戰國策,爆發客戶資料外洩事件,包括代管主機的登入密碼與客戶的資料,都在搜尋引擎上找得到,目前多數搜尋引擎已經清除這些個資,建議使用者立即更換密碼

國內知名的網站主機代管服務廠商戰國策,日前爆發訂單系統資料外洩事件。當時透過Google輸入特定的關鍵字,可以找到4,270筆「訂單詳細資料」網頁,而這些網頁的資訊包括了客戶公司名稱、聯絡人姓名、身分證字號、電話、地址、電子郵件、交易方式、金額、主機方案,以及代管主機的IP位址、帳號、密碼、網域名稱等資訊。建議使用該代管服務的使用者,應該立即更換密碼。

戰國策行銷部經理吳婉真表示,該公司於1月9日上午就已經發現此一事件,旋即做出處理,並且通知Google,要求將快取檔案移除,Google已於1月10日將相關快取頁面移除。吳婉真說:「我們內部系統一直以來都有IP認證,這次會發生這樣的問題,是因為Google的網路蜘蛛程式不知何故造成,詳細的原因我們也還在調查中。之後我們會持續改進,強化資訊安全的防護,對客戶負責到底。」

由於戰國策不願說明造成此事件的原因,目前也只能透過幾個方面猜測原因。一位不願透露姓名的主機代管廠商主管表示,如果有做到登入身分的控管,例如IP位址與登入帳號、密碼的比對等,Google的網路蜘蛛程式不可能有辦法存取內部訂單系統的資訊。他說:「最有可能的是系統做了異動之後,忘記加上身分認證的功能,然後內部管理人員的瀏覽器安裝了類似Google Toolbar的工具軟體,使得Google的伺服器可以收集到內部系統的網址,網路蜘蛛才有辦法循線收集到這些網頁。」

一般人可能沒有注意, Google在隱私權條款中寫到,「當您造訪我們網站或使用我們的其他產品時,Google伺服器會自動記錄資料,包括URL、IP地址、瀏覽器的類型和使用的語言以及造訪日期和時間。」

為了防止網路蜘蛛程式搜尋資訊,多數網站會在網頁上放上宣告網路蜘蛛禁止存取範圍的「robots.txt」文件檔,根據記者的調查,現在戰國策網站上的robots.txt最後的修改時間是在1月9日下午7點。但並無法確定當時這個宣告檔是否有起任何作用。

截至記者發稿前,仍可在較不知名的搜尋引擎上找到這些「訂單詳細資料」的網頁,建議該公司的客戶應該立刻更改系統的密碼,以免網站被入侵。 

研究:2008企業資料外洩大幅增加

研究:2008企業資料外洩大幅增加
http://www.ithome.com.tw/itadm/article.php?c=52921

2008資料外洩件數總計有656件,比2007年的446件增加了47%;一般企業的資料外洩有愈來愈嚴重的傾向,自2006年佔21%增加到去年的36.6%。

根據資料竊盜資源中心(The Identity Theft Resource Center,ITSC)周二(1/6)所公布的報告,2008資料外洩件數總計有656件,比2007年的446件增加了47%;其中一般企業的資料外洩情況更有愈來愈嚴重的傾向。

去年8月ITSC就曾發表相關數據,指出截至去年8月為止,資料外洩件數就已超越前年一整年的結果。不過,此一資料外洩增加的案件比例與去年相仿,2007年的資料外洩件數亦比2006年增加4成。

ITSC主要觀察五個產業的資料外洩情況,包括一般企業、教育、政府及軍事單位、健康及醫藥產業及金融產業,發現一般企業的資料外洩有愈來愈嚴重的傾向,自2006年佔21%增加到去年的36.6%,教育領域則是自28%減少到20%,政府及軍事單位則是自30%大幅降低到16.8%,健康醫療產業從前年的13%到去年的14.8%,金融產業則是自8%增加到11.9%。

根據ITSC的報告,所有的資料外洩案件中,只有2.4%採用加密等重要保護方式,只有8.5%有密碼保護,這代表非常多的外洩資料完全沒有加密或密碼保護。

至於資料外洩的途徑,ITSC表示,雖然人為的疏失已有大幅改善,但仍佔35.2%;而旅行中資料遺失則佔20.7%,意外揭露佔14.4%,駭客惡意攻擊及內部竊賊的比例約佔29.6%。其中,內部竊賊的比例達15.7%,為前年的兩倍,駭客則佔13.9%。

電子型態的資料外洩也以82.3%遠超過文件資料外洩的17.7%。而有通報的外洩資料總計為3570萬筆,但其中尚有41.9%的案例未通報,因此波及的資料筆數應該更多。依此比例換算,2008年外洩的資料約達8520萬筆。

根據這三年來的結果分析,ITSC建議各單位盡量減少讓使用者存取個人身份資料的機會、要求在行動裝置上儲存身份資料的用戶要加密這些資料、限制可將機密資料帶出辦公司的人數、加密所有傳送或備份的資料、要丟掉紙本機密資料時務必完全銷毀、確保儲存機密資料的電腦或伺服器安全,以及訓練員工保護資料的習慣等。

資料完全銷毀

資料完全銷毀
http://www.ithome.com.tw/itadm/article.php?c=56148&s=1

很多不同的資料銷毀方式,流傳在這個世間。但是到底要做到什麼樣的程度才能確保儲存媒介上的資料完全銷毀呢?以硬碟為例,如果把硬碟丟到水裡,就完成了銷毀工作嗎?

很多不同的資料銷毀方式,流傳在這個世間。

但是到底要做到什麼樣的程度才能確保儲存媒介上的資料完全銷毀呢?以硬碟為例,如果把硬碟丟到水裡,就完成了銷毀工作嗎?消磁機真的萬無一失嗎?或是用火燒整臺硬碟,真的就可以完全銷毀資料嗎?

這些疑問,我們都將透過這次的報導替你解答。透過各個領域的專家,剖析紙類、硬碟、磁帶等儲存媒介,用哪一些方法才能真正達到「資料完全銷毀」的結果,解答各種小道偏方的實用度。

資料真的徹底銷毀了嗎?
網路上常會看到一種摧毀硬碟的方法,那就是把硬碟丟到水裡泡水,但是這樣真的就完全不可能救回資料嗎?這可能不一定。

硬碟篇─徹底銷毀硬碟資料的7大方法
我們將要介紹7種不同銷毀硬碟的方法,這些方法分別是格式化、滴鹽酸、火燒、鐵鎚敲、泡水、消磁與刀割碟片。

紙類篇─碎斷式碎紙機才能夠完全銷毀紙張
如果碎紙時,依照文字排列的方向放入長條式碎紙機,結果就很有可能會是整行的字依然清晰可見,無法達成資料銷毀的效果。

磁帶篇─縱面剪斷才能確保磁帶銷毀
之所以要用縱面剪斷的方式,是因為如果採用橫面剪斷的方式,還是有可能讓有心人士從片段的磁帶取得資訊。

重大個資外洩又一起

重大個資外洩又一起
http://www.ithome.com.tw/itadm/article.php?c=55693
目前立法院在協商的「個人資料保護法」,要求擁有5千筆個資的機構就必須要遵守個資法的規定
上個禮拜東森購物又傳出一起個人資料外洩的事件,這次是有一位自稱為阿哲的民眾,在網路上張貼販售東森購物交易資料的訊息,說他因為輸錢而急於求現,1筆資料只賣0.5元,而且他還為了取信於人,特別將內含8千筆交易資訊的Excel檔案,放在網路硬碟供人下載。

我們知道消息之後,循線下載到這個Excel檔案,看到裏面所記錄的交易資料,真是觸目驚心。這個檔案是2008年11月7日的交易記錄,內容詳細記載了訂單日期、客戶姓名、商品名稱、訂單金額、付款方式、配送地址、家裏電話、行動電話、信用卡號、發卡銀行、信用卡過期日期等等資料,看了不禁讓人捏一把冷汗。

8千筆個人資料已經是不小的數目了,目前立法院在協商的「個人資料保護法」,要求擁有5千筆個資的機構就必須要遵守個資法的規定,更何況這位阿哲釋出的這8千筆資料只是做為示範,如果他真有打算要藉此謀利,而且1 筆只賣0.5元的話,那顯然他手上握有大量的東森購物交易資料,如此事態就更加嚴重了。

從初期外洩資料的完整性來看,這份資料很可能是由內部流出的。據知情人士指出,東森購物是以一個單獨的資料庫來記錄交易信用卡的卡號,而客戶訂購商品品項則記錄在另一個資料庫,然而這份Excel檔則同時記載著信用卡卡號與商品品項,可見這個Excel檔已經合併了多個資料庫的資料,也因此,其中不乏資料整併的錯誤。姑且不論資料的正確性,光是要能合成出這份Excel資料,而且還被公開地展示,用來招攬生意,足以見得事態的嚴重性。

線上購物網站掌握的客戶資料頻頻外洩,讓詐騙集團有機可乘,事件層出不窮,無法有效杜絕,使得各界不得不重視個人資料隱私保護的重要性。現在,新版的個人資料保護法立法在即,雖然仍處於藍綠立委協商的階段,但在整個國際大潮流的趨使下,個人資料保護法終究會通過,只是時間的早晚而已。而東森購物這件個資外洩的事件,正可以讓我們思考個資外洩的防護上,除了要抵擋外部竊取之外,也得防範內部同仁蓄意外流。關於這個事件的經過與進一步的分析,請見本期新聞報導(請見第16頁)。

本期封面故事則是報導明年企業財報格式的新標準──XBRL,全名為Extensible Business Reporting Language,是一個以XML為基礎的財務報告語言,希望藉由XML結構化標籤的優點,讓財務報告有一個共通的資料格式的標準,使得財務資料的取得、交換與分析能夠更加方便。

你可以想像一下,德國公司的系統可以直接讀臺灣公司的財報?這件事在目前並不容易達成,需要透過種種的轉譯才行;但是如果臺灣公司的財報是遵循XBRL格式,那麼德國公司就算是看不懂中文,只要其系統能支援XBRL,就可以直接讀出財務報表裏的財務資訊,絲毫不須理會這份財報可是用中文寫的。

可以想見,企業財報採用XBRL國際標準後,可以跟國外的資本市場有更好的連結,這也就是證交所要求上市櫃公司提交XBRL格式財報的原因。明年9月以後,所有上市櫃公司的財報就都有XBRL版本,而未來XBRL還可以延伸至非財報的應用,目前有些國家已經率先進行,值得觀注。(請見第24頁) 

國泰世華新核心系統上線虛驚一場

國泰世華新核心系統上線虛驚一場

http://www.ithome.com.tw/itadm/article.php?c=55399
國泰世華銀行的核心系統轉換,在端午節4天連假中順利完成。不過,新核心系統上線第一天,部分交易服務就一度停擺,其中,除了網路銀行以及補摺機等自動化交易服務之外,匯出匯款業務也曾暫停。國泰世華銀行表示,主要是因為交易量爆增,加上分行人員對新核心系統還不熟悉,進而影響到系統效能。

國泰世華銀行資訊長章光祖說:「新系統上線,小狀況多多少少一定會有,但是整體來看一切都很順利。」而新系統上線第一天就出現部分服務停擺的棘手問題,主要是因為交易量瞬間爆增,加上分行臨櫃人員對於新系統不熟悉,進而造成系統的反應速度緩慢。

章光祖進一步表示,為了讓分行臨櫃作業順暢執行,國泰世華不得不短暫停止自動化交易等局部服務,進而調整硬體資源配置,並且把資源集中在分行等第一線交易系統上。國泰世華銀行的新核心系統,在經過2年多的開發之後,去年11月正式邁入測試階段,過程中,經過將近半年的嚴格測試,最後決定在5月底的4天連假進行轉換,但是,新系統上線的第一天,就承載了70萬筆的交易量,相較於平日至少增加了3成,對於系統造成的負擔無庸置疑。

由於新核心系統上線的第一個營業日,是在4天連假結束之後,而且又適逢月底轉換月初,所以,交易都擠在同一天而爆增。國泰世華銀行新核心系統專案經理闕壯興表示,新核心系統上線之前,就經過10次的測試,舉凡月初日、月底日、發薪日等都是原本就預想過的情況,也針對這些情境做過測試,因此,即使新系統上線的第一天,就出現系統資源緊繃的狀況,但在經過適當的調整之後,自動化交易服務等問題都在半小時內得到解決。

除此之外,為了讓第一線的作業即時完成,國泰世華也把一般匯款業務,放到第二順位處理,進而把IT資源集中在公司戶以及證券交割等方面的業務處理。為了因應這樣的調整,國泰世華銀行事先已經跟財金公司提出申請,才能把匯款業務的作業時間往後延長一個小時。

國泰世華銀行原本的核心系統在5月28日零點正式走入歷史,新的核心系統也在5月29日凌晨1點鐘啟動,中間只有停機25個小時,遠低於國泰世華銀行合併時,停機40個小時的記錄,也比原訂目標提早了1小時完成。過程中,國泰世華銀行把服務據點區分成分行、便利商店以及捷運等4大群組,然後依序啟動。文⊙楊惠芬 

機場當機與希捷韌體事件的省思─你的硬碟還健康嗎?

機場當機與希捷韌體事件的省思─你的硬碟還健康嗎?
http://www.ithome.com.tw/itadm/article.php?c=53597&s=2

機場當機與希捷韌體事件的省思─你的硬碟還健康嗎? 
今年初始,就發生了兩起和硬碟相關的大事件,首先是1月5日,桃園機場大當機36個小時。根據移民署的說法,起因是硬碟與磁碟陣列系統過度老舊,導致1、2航廈儲存系統的硬碟同時損壞,讓整個出入境系統無法運作,這一事件的後果就是,在當機的36個小時中,有8名通緝犯成功的逃亡出境。然後在1月19日,全球最大硬碟製造商希捷(Seagate)在官網上坦承包括Barracuda 7200.11、DiamondMax 22以及企業等級的Barracuda ES.2在內的3個系列硬碟產品,許多型號的韌體都必須更新,否則可能會導致BIOS無法找到硬碟、通電後無法動作、系統當機等問題。此消息一出,使用者一片譁然,某位不願具名的磁碟陣列經銷商更表示,他至少賣出了數千顆有問題的硬碟,幾乎不可能一一協助企業更新韌體。

機場當機事件:
備援系統的硬碟也失效
先來看看桃園機場的事件,內政部移民署副署長黃碧霞在先前接受iThome電腦報周刊訪問時指出,因為系統老舊,線上和備援系統的硬碟同時損壞,是當時機場大當機主因。此外,維護廠商對系統的不熟悉可能也是原因之一。據了解,由於護照查驗系統的維護,是每年一標的維護案,而「98年度電腦設備暨相關軟體維護案」的競標,是在2008年12月31日決標,系統維護廠商在事發前,才剛從大同公司轉由神通電腦負責,兩家公司並沒有正式完成交接,神通電腦是在完全不了解系統架構與概況的情況下,搶修護照查驗系統。

由桃園機場的事件,企業使用者可以看到幾個教訓,首先就是,硬碟定期更換對於企業和組織的重要性。但問題是有多少企業有定期監測硬碟的使用狀況?超過保固年限是否就會更換?桃園機場的前車之鑑正好再次提醒了使用者,在企業的應用環境中,硬碟健康狀況的確認,是十分重要的一環。除此之外,維護人員對於儲存系統的了解,也必須是企業重視的一環,否則在系統出問題時,很有可能會因此無法快速修復系統,導致影響營運的時間更為拖長。

希捷硬碟韌體事件:
出錯原因不明,開關機頻繁可能會導致硬碟失效
而另一個事件,希捷的韌體出錯事件,則和上述不同,是企業自己也無法預防的產品瑕疵事件,當企業遇到這樣的事情時,為求安心,可能需要大規模的更新韌體。這件事說起來簡單,實際上卻是吃力不討好的工作,因為這代表著企業的資訊人員必須先將資料備份,然後停止磁碟陣列的運作,之後再一臺一臺的將硬碟拿出來與電腦連接,進行韌體更新。如果硬碟數量一多,在實際執行上,這幾乎是不可能的任務。在網路上討論區中,就有人指出,依照希捷提出的型號,該公司有480顆硬碟必須更新韌體,如果依照上述的做法進行更新,非常曠日廢時。

關於這次事件,希捷的官方聲明稿中坦承韌體出錯,但對於韌體如何出錯的技術細節,則完全沒有提及,僅在聲明稿中重申,硬碟因為此一問題而毀壞,資料並不會因此消失,並且提供客戶服務的網址與連繫電話。一位不願具名的磁碟陣列廠商表示,他們現在也無法確定韌體出錯的真正問題,與希捷技術人員溝通的過程中,技術人員對於問題所在也語焉不詳。但根據他們的實測,系統開關機的次數越頻繁,硬碟越有可能發生希捷所描述的症狀。

對於此一問題,截至截稿前,臺灣希捷都不願意提供我們關於此一事件技術方面的任何回應,因此我們也無法證實是否上述的說法為真。不過企業也不需過度恐慌,根據目前的了解,多數磁碟陣列廠商都表示,目前希捷硬碟有問題的型號,在企業端磁碟陣列上使用,都還沒有客戶回傳發生錯誤的消息,可見影響層面不大。

1月19日,希捷在官方網站上坦承三種型號的硬碟韌體出錯,可能會造成BIOS無法找到硬碟、通電後無法動作、系統當機等問題。

上市櫃公司明年財報須遵循XBRL

上市櫃公司明年財報須遵循XBRL
http://www.ithome.com.tw/itadm/article.php?c=53185

2010年中開始,臺灣所有上市上櫃公司申報的財務報表格式將有重大變化,企業必須採用XBRL標準來製作財務報表,證交所已先建立XBRL示範平臺來宣導。

臺灣證券交易所於去年12月29日啟用XBRL示範平臺,宣示了臺灣股市財務資訊開始邁向標準化的第一步。未來,所有上市上櫃公司申報的財務報表格式,將有重大變化。

上市上櫃公司必須定期申報企業財務資料,過去主要用Excel檔或PDF檔來製作這些財務報表。但是,從2010年的半年報開始,金管會要求上市上櫃公司,須採用XBRL格式來製作申報的財務報表。金管會表示,初期參考國外實施方式,先採雙軌制,企業同時要提供新舊格式的財務報表。

XBRL(eXtensible Business Reporting Language)是國際最常使用的財報資料格式,在XBRL格式中,採用XML語法來呈現財務報表的會計欄位資訊,美國早在4年前就開始試行。

上個月17日,美國聯邦證券交易委員會(SEC)更進一步強制規範,資本額500億美元以上規模的企業,從2009年起,要開始提供XBRL格式的財務報表,其他公司則需在兩年內採用。

相較於美國,臺北商業技術學院會計資訊系教授周濟群表示:「臺灣導入XBRL的時間比較晚,大約和南韓、泰國同步。日本、中國早已採用,新加坡甚至運用XBRL格式來製作一般工商資訊的相關報表。」

金管會表示,臺灣將從2010年的半年報開始實施XBRL,強制規範上市上櫃公司採用XBRL格式來製作財務報表,同時也增加申報的報表種類,從過去的兩大表增加為四大表,包括資產負債表、損益表、現金流量表及股東權益變動表。

不過,對於企業提供的附註資料,例如公司介紹、文字敘述、圖片等資訊,則是參考美國2005年的簡化版本,以段落為單位來加註XML標籤,減少企業的轉換負擔。金管會表示,在轉換初期,會先採取雙軌制,讓新舊格式並行,確保資訊的正確性和完整性。

換言之,從2010年下半年開始,企業必須提供兩種不同格式的財務報表電子檔,包括舊有格式和XBRL格式各一份。

為了向企業推廣XBRL格式,從去年底開始,臺灣證券交易所舉辦公聽會,並且建立示範平臺,將過去五年的財務報表資料轉成XBRL格式的資訊,還在平臺上提供交叉分析工具。臺灣證券交易所上市服務部副理陳欣昌表示:「財報資訊透明化以後,更容易進行深入的投資分析。」

陳欣昌解釋,格式統一後,投資人就能很方便地使用電腦軟體來分析XBRL格式的財報資料,不需自行從各家企業的報表中人工彙整資訊。此外,「因為XBRL是國際標準,所以,還能用來和國外企業的財報資訊比較,財報資訊的利用更多元。」陳欣昌說。

對企業而言,周濟群認為,XBRL有助於跨國企業的內部營運,他說:「若企業ERP總帳採用XBRL格式,就能用同一套標準來符合各國的規範,更容易管理各地子公司的財務資訊,像SAP或Oracle等國際大廠的ERP都已內建了XBRL格式。」

企業財報採用XBRL格式,還需有一套共同的會計分類標準。臺灣證券交易所的XBRL工作小組已開始制訂這套分類標準,目前正在蒐集企業與各家會計師事務所的意見,預定於今年第三季公布。

為了降低企業轉換報表格式的負擔,陳欣昌表示,臺灣證券交易所將免費提供轉換格式的軟體,類似現行的軟體報稅工具,讓企業或會計師事務所可以很容易製作出符合XBRL規範的財務報表。

目前,臺灣證券交易所宣導XBRL的對象,先以企業財務人員與會計師事務所為主,但是,周濟群建議企業資訊部門可以開始了解,他說;「以臺灣現行會計運作方式,多由會計師事務所產出最後的財務報表,初期對資訊部門的影響不大,但長期而言,XBRL是企業會計資訊的基礎,CIO需要開始了解XBRL的發展。」文⊙王宏仁

透過XBRL,傳統財務報表的會計資訊可轉換成用XML表示的資料檔,讓投資人更容易用電腦軟體來分析財務資料。

資料整合的新一波趨勢︰主資料(Master Data)管理

資料整合的新一波趨勢︰主資料(Master Data)管理
http://www.ithome.com.tw/itadm/article.php?c=52201&s=1

在企業IT整合的方法中,專門針對主資料管理的解決方案和技術,逐漸成為許多大型軟體供應商所強調的部分,包含ERP、資料庫、資料倉儲等廠商,都已正式推出具體的產品。

對當前的企業來說,如何讓既有的資訊變得更正確、精準,仍不太容易。而且這些資訊當中,有些類型相當特別,因為是許多應用系統、交易程序都會用到、存取的部分,所以很重要,等於與企業營運的命脈密切相關,這種資料稱為主資料(Master Data),舉例來說,它們可能是所謂的基本資料,包括顧客、產品、員工、地點、資產、原料等主題。
企業必須設法維護主資料本身,做到一定的品質,例如內容的可信度高,同時又是獨特而不重複的;而且,重點是主資料要在既有的營運流程中妥善運用,例如銷售、行銷、財務等,協助企業內外相關的使用者,能夠在流程上更快速地作業。

此外,企業也逐漸意識到,可以藉助主資料與既有系統的搭配、運用,來改善既有的商業流程與決策,這些因素都使得主資料管理(Master Data Management,MDM)受到更大的關注,幾乎是繼商業智慧之後,再次驅動資料整合下一波應用的新動力。

用法上容易與資料倉儲混淆
因為牽涉到交易系統的處理程序,MDM的實際資料處理作業上相當複雜,而且需要考量到多種因素。所以當我們一開始去修改資料時,雖然執行程序和路徑要維持不變,但這些資訊的變更,不只是要傳到主資料管理系統上,然後這套系統的資訊,也要能再傳回既有系統上。

而且,到了其他系統都可以和MDM相互存取的階段,會有一種複雜的狀況發生:當後端的資料庫異動,而主資料管理系統本身的資料,也因其他系統的作業而變更主資料內容時,這兩邊的資料同步該怎麼處理?
從MDM到既有系統之間,固然可以採用發布與訂閱的方式來同步處理,但相反地,資料從既有系統如何同步到MDM才是重點。目前雖然有既定的工具可運用,但是這些又跟主資料管理系統無關,只是執行專案過程中一定要做的事情。總而言之,這些過程企業需要通盤考量,並且找到比較理想的技術和方式。

還有更複雜的,例如MDM和資料倉儲相互搭配。很多人可能會把資料倉儲和主資料管理混為一談,以為兩者都在做一樣的事情。其實資料倉儲對MDM而言,屬於既有系統的範疇,因為那邊的資料通常是由應用系統端,透過ETL工具再進到資料倉儲,然後這裡面又可能衍生出好幾個資料超市(Data Mart)。

這麼看來,主資料管理和資料倉儲之間似乎存在一些曖昧的關係,但它們之間有何不同?

如果主資料管理裡面的顧客資料,已經有一個完整的檢視,而且內容是最新的,這些資料其實是可以給資料倉儲來使用的。但資料倉儲本身在處理過程中,會再分析出很多資訊,這些過去很少回饋至交易系統端。如果能做到,前端服務的專員能夠同時掌握顧客的VIP等級與流失率,業務運作上會更妥善。

就主資料管理和資料倉儲而言,它們之間是相互協調的,而不是彼此取代。

兩者的定位差異在於,主資料管理系統必須要能讓前端的服務人員可以使用,而不只是藏在後端系統而已。

兩者也有共通之處──都要求資料是正確的。由於資料倉儲會執行資料清理(Data Cleaning)的工作,當資料進到資料倉儲時會經過修正,但這些異動不會自動回溯到應用系統當中的後端資料庫,因此錯的資訊還是錯的,而對主資料管理來說,這些錯誤的確是需要去更正的。

一般人或許會認為,資料倉儲只是客服中心的一種應用系統。我只能說,的確是可以在這樣的系統上去建立一個客服中心系統,大部分企業雖然已經建置了,但裡面的系統其實只服務客服中心本身的需求,而不是全部的人,所以觀念上不同。單靠客服中心手上的資訊來整併,成效還是有限,而且一不注意,可能會因此誤認所有的主資料,都需要以客服中心的資料為重。

用Data Hubs的做法來整合主資料
很多人也許會問,透過資料庫這類儲存庫來彼此同步裡面的內容,不是就可以解決主資料整合的需求嗎?

問題在於,這樣的關係裡,當某個系統的資料更動之後,另一個系統就面臨到是否需要同步處理的狀況。企業通常有N個系統,它們之間或許會相互將資料同步處理,但並非全部系統的資料都處於同步的狀態,通常只選幾個來實作,光是這樣的串連,機制就很複雜,因此會產生很多技術上的問題。

這其實和資料庫處理的觀念有關。也就是所謂的兩階段確認(Two phase commit)。如果修改資料,按下「完成」後,內容直接變更(Update),這叫做One phase commit;但兩階段確認是資料處理完成後,由於要連帶更新另一個系統的資料,所以並不立即宣告「完成」,而是確保兩邊的資料都變更了,交易才算完成。

如果沒有一套系統在中間串連,企業就要自行在不同系統之間,設法做到兩階段確認,這將會衍生一個問題:假設有12個系統要同步更新資料,資料變更時,要等12個系統都完成作業時,前端才會收到「完成」的資訊,也就是說,企業完全無法控制資料處理的效能。

對MDM來說,資料變更時,這些異動只發生在這個系統內,但MDM會將這些資料的最新版本,發布給相關其他的系統去同步。

如果是由主資料管理系統來協調這些動作,是有點像是中介軟體在扮演的角色。IBM軟體產品處軟體系統架構顧問巫介唐提到,就該公司的解決方案來說,實際上是靠EAI和Services元件的技術。

換句話說,MDM本身不直接去處理這些資料的異動,但是它會去擷取(Capture)那些資訊,把它們送給EAI,現在很多MDM廠商的產品都具備這樣的功能。通常這種技術叫做「發布與訂閱(Publish and Subscribe)」,幾乎是所有EAI廠商都具備的特色。

也許你會以為,MDM直接溝通每個系統後端的資料庫、儲存庫等資料儲存。其實不然,既有的應用系統仍直接依照原先的方式,去存取後面的資料庫系統。不過想做到這個目標,困難之處在於如何相容於既有的架構,逐漸發展成理想的架構。

巫介唐說,像這樣去改變資料處理與存取的路徑需要時間,固然須靠有經驗的廠商來引導,但目前臺灣還沒有企業以這樣的方式去發展,所以整體上,仍缺乏實際可參考的案例;而且過程可能得花上10年以上,絕對不是花點錢、1年內就能做得出來的。

妥善運用,能使企業免於違反法規
MDM應該是在企業內部裡面去建置、使用的,不過就像上述研究機構所分析的全球各地的應用狀態,有些企業以SaaS的方式來應用主資料管理。根據巫介唐的判斷,這種狀況可能是因為國外的企業可以合法買到顧客資料,例如Gartner將這種業務稱為Customer Data Integration(CDI),但這類解決方案較針對Party,即顧客資料,其他層面的主資料較少涵蓋到。

有種CDI的做法其實也和SaaS有關,Gartner稱為External Reference Style。在這種方式中,當企業要去查一個顧客的資訊時,可以從外部的系統取回資訊,更進一步了解顧客的基本資料,作為後續評估,例如是否結過婚、所需照顧的子女數。

這種服務的形成,是因為有很多顧客本身的基本資訊,在其他廠商的應用系統當中,都已經建檔,既然當地允許企業販售顧客資訊,所以這種SaaS是有可能存在的。

至於MDM跟法規遵循有關,也不難理解。因為透過這類型系統的操作,企業將能看到所謂的Portfolio──顧客所擁有或購買的產品,以及跟公司的關係。看到這些資訊後,企業能夠發起一些行銷活動,去延伸規畫更引起對方購買欲的產品組合,像是這個顧客是否適合其他產品的交叉銷售(Cross-sale)。這些資訊除了來自企業自身營運用應用系統內的主資料,也很可能是從資料倉儲端匯入,更進一步地還可能包括隱私資料或是偏好。

一旦企業直接運用這些資料,卻沒有注意到有人可能對接收這樣的行銷廣告行為感到反彈時,就很可能會因此觸法。因為企業發起行銷活動時,並沒有主動排除那些不想受打擾的顧客。

某些國家甚至有這樣的法令來約束公司行號的行銷手法。像美國國會曾經制定「勿來電」執行法 (Do-Not-Call Implementation Act),並且授權聯邦貿易委員會建置「勿來電」登記系統,成立一個National Do Not Call Registry的資料庫,任何一個人只要打電話去登記資訊、加入這個計畫,政府就保障這個顧客不會受到所有廠商的電話產品推銷,造成騷擾。

這將會造成一種狀況:通常這些情報往往只能全部蒐集進來,之後企業以此大量發送傳單,如果沒有這方面的過濾機制,例如在主資料管理系統裡面加註,就無法確定本身是否能遵守這樣的法令要求,作業上一定會有失誤。

DB2與關聯式資料庫的深厚淵源

DB2與關聯式資料庫的深厚淵源
http://www.ithome.com.tw/itadm/article.php?c=50930&s=5

關聯式資料庫管理系統這項技術發展已將近40年,它和IBM有很深厚的淵源,從理論、實作、產品化,到了1983年正式推出DB2第一版,這個時間點距今剛好滿25年。

從第二版開始參與該項產品研發的IBM矽谷實驗室查詢技術部DB2 z/OS資深研發經理傅毓勤表示,DB2不只是IBM的第一套關聯式資料庫產品,假如也將早期IBM奠定理論和推動實際應用的基礎等因素考慮進來,說它是業界第一套關聯式資料庫,當之無愧。

理論建構:關聯式模型
關聯式的資料模型理論是在1970年出現,由IBM研究院的E.F. Codd發表了業界第一篇關於關聯式資料庫技術的重要論文,題目為〈A Relational Model of Data for Large Shared Data Banks〉。

Codd認為,將來如果在共享的環境下,需要管理大量資料,關聯式模型(Relational Model)是最強大的一種構想。當時這僅止為一個研究方向,必須要發展、實現出一些基礎的技術,因此IBM繼續在這方面發展。

SQL語法與查詢最佳化的濫觴
首先要建構的是程式語言,這些關聯性需要特定的運算子(Operator)去表達、怎麼做聯結(Join),都需要靠一套語言來加以規範與定義。後來SEQUEL查詢語言的出現,再加上查詢最佳化的技術理論的推出,都是很關鍵的發展,讓這個模型可行性越來越高。

在1974年,IBM的Don Chamberlin和Ray Boyce共同提出一篇論文〈SEQUEL:A Structured English Query Evaluation Language〉,主要關於一套全新設計的程式語言,用在關聯式資料庫的資料存取和操作上。顧名思義,SEQUEL是一種口語化查詢語言,使用上就像一段英語敘述,而且語意是完備的、不會有矛盾。

這部分的成就也成為1986年後的ANSI/ISO SQL標準的基礎。這兩位等於SQL語言的鼻祖。這項技術,等於把關聯式模型落實成一套真正存在的語言,你可以用它來描述怎麼去查詢,在實用度和處理能力上是一個躍進。

SQL運用在程式開發上,和既有的程序式程式語言(Procedural Language)上有很大不同,傅毓勤認為,你所要描述的是What而不是How,例如你只要指定特定的資料表加以連結,而非把宣告變數、資料型別、運算子、表示式、迴圈相關的敘述等所有細節,一五一十地寫出來。當時,這也是被人質疑的。究竟這樣的語言能不能有效地實現出來,換句話說,還需寫出一個編譯器來剖析這樣的程式,執行最佳化。

於是,1979年,IBM的Patricia Selinger在美國電腦協會的SIGMOD 大會上發表一篇〈Access Path Selection in a Relational Database Management System〉,這是第一份有關於關聯式模型查詢最佳化的論文,也確立了今後SQL查詢最佳化(SQL Query Optimization in RDBMS)的發展方向。傅毓勤說,放眼望去,幾乎所有的優化工具,都是憑藉這個基礎發展出來的。

在資料庫發展上要做到最佳化查詢,通常會遇到NP Hard等級的問題,要找到最好的演算法一直很難,因為時間耗費通常與資料表數量的增加成指數成長,比如要處理30個資料表,可能就得用到天文數字般的處理量,但Patricia Selinger提出用工程來解決的方法,例如根據查詢的複雜度、回傳結果的資料量、也就是預估各種存取資料方法的成本,用布林表示式來決定對應的存取計畫。

SQL/DS和DB2 for z/OS
這兩項理論讓關聯式資料模型就不再是那麼抽象的名詞,實現的可能性大增。接下來還有三件事在歷史上很重要,就是如何產品化,使DB2成為一套能夠真正用在業界的產品。

1982年,IBM基於System R和SQL推出全世界最早的商業化關聯式資料庫SQL/DS,用在VSE和VM這兩個大型主機的作業系統上,它也是第一個針對查詢處理程序(Query Processing)的系統;隔年他們又將SQL/DS一部份作為新的資料庫產品Database 2的基礎,DATABASE 2即為我們目前慣稱的DB2。也就是說,SQL/DS是DB2的前身,所以DB2也算是從System R衍生出來。

為什麼叫做Database 2?原因是IMS是IBM發展出的第一套階層式資料庫管理系統,而相對於階層式模型,他們認為這套新的系統是第二代的資料庫系統。

DB2的第一個版本,當時主要用在決策支援方面的少量查詢,還無法真正運用在交易上,例如銀行的核心業務。到了1988年第二個版本發行時,又有了一個革命性的改變,Don Haderle、Jim Teng(鄧之嘉)、Howard Herron帶領開發團隊,將交易率大幅提升,讓DB2成為可以真正用在交易的資料庫系統。

加入並行處理演算法和資料分享的架構
一套資料庫管理系統除了能簡化資料存取、負擔線上交易,在可用性、延展性和可靠度也需要提出保障。

可用性的強化上,主要是Aries的並行處理演算法,它是由C. Mohan和Don Haderle在1980年代中、晚期所發展的。這個計畫主要是針對並行處理的控制(Concurrency Control)上,把鎖定(Lock)的技術從資料頁(Page)降到資料列(row)的等級,因為粒度變小了,所以並行處理的效率大大提升,這也讓系統復原比較有效率。

在可用性和延展性,還有一項關鍵技術,傅毓勤特別強調是DB2至今仍獨有的,那就是資料共享(Data Sharing)。在1988到1994年當中,IBM極力想讓這個平臺的處理能力能夠獲得突破性的改變,他們提出了Sysplex的架構和資料共享的技術,這是由Inderpal Narang、C. Mohan, Don Haderle、Jim Teng和Jeff Josten帶領的團隊所發展出來的。在DB2 for MVS V4,IBM也開始運用這樣的技術。

這個架構是指,你可以同時有多個執行DB2系統的成員,它們能在不同的主機上執行,然後合起來成為一個叢集,共享同一個資料庫;它們可以各自執行自己的應用程式,也可以合起來執行同一個應用程式。

傅毓勤表示,以可用性來說,合起來之後,它們之間是共享的,假設成員當中有一個停機、無法運作,其他成員會自動繼續維持運作,系統不需要額外執行其他容錯的機制,除非全部成員停止運作。

Sysplex還能用於延展性和工作負載平衡,例如動態加入新成員來分攤處理。這些成員共享了資料庫,它們可以執行在相同或不同的邏輯分割區(LPAR);如果分散在不同硬體上,它們彼此還可以相互支援處理,將工作負載分配至同時段比較閒置的主機上。文⊙李宗翰