組織 XML 的字彙(Vocabulary)
對於所謂的 e-business 而言,如何在企業與企業之間或企業與供應商(supplier)之間分享彼此的資訊以應付快速變更的 INTERNET 網路經濟是重要的課題。而其中的現實考量的因素就在於各自的資訊系統之間: ”如何交換資訊?”,以及,“要交換什麼資訊?”。
”如何交換資訊?” 從早期某些廠商所推出的 EDI(Exchange Data Interface)解決方案,其實已經有為 e-business 用戶考量到這需求,但最大問題在於”沒有標準化”,而顯然 e-business 的交換資訊已是必然的趨勢,”標準化”的制訂也就必須由一國際公認的組織來推動了。
“XML”就是這個需求下所發明的產物。由 W3C 於 1996 年所制訂的規格,目的就在於期望可以在跨不同平台系統的前提下,能以一種標準化的文件格式,來達成 e-business 之間的資訊交換。統一、簡單、可自行定義標籤來依照需求產生不同格式文件、並易懂易學,正是 XML 規格制訂的目的。
使用 XML 規格來制訂文件的標準而得以使得 e-business 之間的資訊交換已是現今 e 化的公司所懂得來運用的共識了。資訊交換的標準化已藉由 XML 規格而能取得共識,再來另一個重要的課題就在於“交換什麼資訊?”。
B-to-B 之間最大的價值當然要能分享彼此的“智慧”,而這個所謂的 “智慧” 不應只是單純的以資料為導向性的。將資料轉換為 “智慧”,顯然地,要能賦予這些資料更多的涵意(semantics)。要能做到讓企業與企業的系統與系統之間,人與人之間、人與系統之間均能有共識,並能瞭解其涵意,則必須要能規定在該領域(domain)之間溝通的字彙(vocabulary)為何?所以,也就是說,”交換什麼資訊?”,其所交換的內文(content)就是由這些字彙所組合而成的。
那麼,什麼是字彙(Vocabulary)?狹義的解釋,即是一串列的術語(list of terms)被使用在 B-to-B 相互的溝通。
然而,如果僅列出這些專業溝通的術語並做成如術語表等個別來解釋這些術語,其實是無法看出它更深一層的涵意(semantics),所謂的涵意,代表著術語與術語之間的關連,是否存在著結合(association)關係、一般化、特殊化關係,甚至字彙的分類等。這些涵意,如果沒有更嚴謹的定義,是不容易發現的。
例如,透過基本的字彙表,汽車組裝工廠與零售商之間可以知道要交換的資料有如汽車、引擎、運輸工具及方向盤、輪胎等資訊,但汽車是否屬於運輸工具的一種?汽車需配置幾個引擎,什麼樣型號的方向盤?可以配置幾個輪胎?如果汽車屬於運輸工具的一種,而飛機也是運輸工具,那麼,汽車是否也可以像飛機一樣在天上飛?所有這些的問題,是無法從基本的字彙表中來找到這些關連性的,而這必須靠完整的定義來表示字彙的涵意(semantics)。
XML 的 DTD 或 Schema規格可以來制訂字彙與字彙之間的關連性,但是,DTD、Schema 規格是以文字的格式用在應用軟體與應用軟體之間溝通的標準,單靠純文字的定義,並不適合用來讓人們來閱讀,人與生俱來就有靠豐富的圖像來理解抽象觀念的能力,顯然,要能表達完整字彙的意涵,單靠文字的定義是不夠的,所以,我們需要一套可以表達字彙的機制來同時支援對人的容易閱讀理解與應用軟體的處理。
UML(Unified Modeling Language),就具有這樣的能力,不僅可以捕捉應用軟體領域模型下的意涵,並且可以把這些字彙的完整定義對應至 XML 的字彙來直接交給 e-business 系統處理。UML 也訂出了標準的圖形表達語法(notation)而容易的被人們來閱讀。