試題四(共25分)
閱讀以下關于數據集成的敘述,在答題紙上回答問題1至問題3。
某互聯(lián)網銷售企業(yè)需要建立自己的電子商務平臺,將所有產品信息集中在一起,為用戶提供全方位的產品信息檢索服務。但產品供應商大多數已經建有自己的電子商務平臺,且數據獨立存儲,而且數據格式和數據平臺有較大差異,有的供應商甚至沒有采用數據庫來存儲
商品信息。為此該企業(yè)專門成立專家組來論證其數據集成方案。
李工提出采用集中式集成方式把產品供應商的數據集中在一起,采用數據倉庫技術來實現與各家供應商的數據集成。而王工提出采用松耦合的聯(lián)邦數據庫集成方案。專家組經過激烈討論,認為王工方案更為合理,建議采用王工提出的集成方案。
【問題1】(10分)
請結合數據倉庫和聯(lián)邦數據庫集成方案各自的特點,簡要說明專家組采用王工提出的集成方案的原因。
【問題2】(7分)
部分供應商的產品信息沒有相應的數據庫,而是直接嵌入在WEB頁面中供用戶瀏覽。數據集成時需要直接從供應商電子商務平臺的網頁上獲取其產品信息。請簡要給出此類數據集成的方法和基本步驟。
【問題3】(8分)
在方案評審會上,項目組針對李工和王工的方案展開了激烈的討論。劉工指出兩種方案在實施的過程中,都存在數據源之間的語義映射和轉換問題,都會帶來數據集成的不確定。請簡要說明產生不確定的原因。