13. www.mbs.msu.ac.th,www.cs.kku.ac.th
การแยกกลุ่มคาถามเพื่อค้นหาคาตอบโดยใช้เว็บเชิงความหมายและการทาเหมืองข้อมูล
2.การจัดหมวดหมู่ของคา(Lexical Chain)
REPEAT
READnext word
IF word is suitable for lexical analysis (see section 3.2.1)THEN
CHECKfor chains within a suitable span
(up to 3 intermediary sentences, and nolimitation on returns):
CHECKthesaurus for relationships (section 3.2.2).
CHECKother knowledgesources
(situational, general words,proper names).
IF chain relationship is foundTHEN
INCLUDEword in chain.
CALCULATEchain so far
(allow one transitive link).
ENDIF
IF there are wordsthat have not formed a chain for a suitable
number of sentences (up to 3) THEN
ELIMINATEwordsfrom the span.
ENDIF
CHECKnew wordfor relevance to existing chains that
are suitable for checking.
ELIMINATEchains that are not suitable for checking.
ENDIF
ENDREPEAT
1. กาหนดให้เซตของคาที่จะสร้าง Chain เป็น n1 .. nm และ v1 .. vm
2. เริ่มต้นด้วยการเลือกคาหลักคานามที่1 (n1) และคาหลักคากริยาที่1 (v1) กาหนดให้เป็น
ส่วนหัวเริ่มต้น Chain ที่1 (Cn1) และ (Cv1) ของคาหลักคานามและคาหลักคากริยาตาม
ลาดับ
3. เลือกคาที่2 (n2) และ (v2)
ค้นหา Chain ตั้งแต่ Cn1 ... Cnm และ Cv1 ... Cvm โดยพิจารณาความสัมพันธ์ในลักษณะ
ต่างๆ ที่ปรากฏในฐานความรู้เวิร์ดเนต ที่ทาให้ n2 และ v2 มีความสัมพันธ์กับคาที่อยู่ใน
Chain แบบใดแบบหนึ่งดังต่อไปนี้
1) Extra-strong (Repection)
2) Strong (Synonym, kindOf, Is-A, hasPart, part of, oppositeOF)
3) Medium-strong (ความสัมพันธ์แบบถ่ายถอด) ถ้าพบความสัมพันธ์แบบใดแบบ
หนึ่ง จะทาการเพิ่ม n2 และ v2 เข้าไปใน Chain ที่พบความสัมพันธ์แบบเหนียว
แน่นที่สุด (mostly strong) หรือถ้าพบความสัมพันธ์ที่มีความเหนียวแน่นเท่ากัน
ให้เพิ่มลงใน chain ที่ update ล่าสุด ถ้าไม่พบ ทาการสร้างให้ n2 และ n2 เป็น
ส่วนหัวของ Chain ใหม่
4. ทาซ้าขั้นตอนที่3 จนถึงค่า nm และ vm
ภาพที่1: ลาดับขั้นตอนการสร้าง Lexical Chain
14. ทฤษฎีที่เกี่ยว้้อง
www.mbs.msu.ac.th,www.cs.kku.ac.th
การแยกกลุ่มคาถามเพื่อค้นหาคาตอบโดยใช้เว็บเชิงความหมายและการทาเหมืองข้อมูล
3. การคานวณค่าน้าหนัก Lexical Chain
𝑆 𝑘 = (
𝑚=1
𝑃 𝑘+1
𝑡𝑓 𝑚𝑘 𝑅 𝑚𝑘 𝑊 𝑚𝑘)𝐻 𝑘
โดย Sk คือ ค่าน้าหนักของ Lexical Chain ที่ k
m คือ คาหลักที่ m
fmk คือ ความถี่ของการเกิดคาหลักที่ m ที่เกิดขึ้นซ้าใน Lexical Chain ที่ k
Rmk คือ น้าหนักของความสัมพันธ์ของคาที่ m ใน Lexical Chainที่ k
Wmk คือ น้าหนักของคาหลักที่ m ที่เกิดซ้าใน Lexical Chain ที่ k
Hk คือ ค่า Homogeneity Index ซึ่งคานวณได้จาก
𝐻 𝑘 = 1 −
𝑃𝑘
𝐿 𝑘
โดย Lk คือ จานวนสมาชิกที่เกิดแตกต่างกันใน Lexical Chain ที่ k
Pk คือ จานวนคาหลักที่เป็นสมาชิกทั้งหมดใน Lexical Chain ที่ k
(2)
(3)
เป็นการคานวณและให้ค่าน้าหนักในแต่ละ Chain ว่าสมาชิกใน
Chain มีความสัมพันธ์กันมากน้อยเพียงใดการหาค่าน้าหนักของ
Lexical Chain สามารถคานวณได้จากสมการ