diff --git a/lib/src/thai/LexiconTha.gf b/lib/src/thai/LexiconTha.gf index ccd2ddc1f..d2521c4b0 100644 --- a/lib/src/thai/LexiconTha.gf +++ b/lib/src/thai/LexiconTha.gf @@ -112,11 +112,11 @@ lin -- like_V2 = dirV2 (regV "like") ; -- listen_V2 = mkV2 (regV "listen") toP ; -- live_V = (regV "live") ; - john_PN = ss "cn" ; + john_PN = ss "จน" ; -- long_A = regADeg "long" ; -- lose_V2 = dirV2 (irregV "lose" "lost" "lost") ; -- love_N = regN "love" ; - love_V2 = mkV2 (regV rak_s) ; + love_V2 = mkV2 rak_s ; -- man_N = mk2N "man" "men" ; -- married_A2 = mkA2 (regA "married") toP ; -- meat_N = regN "meat" ; @@ -368,4 +368,187 @@ lin -- onP = mkPrep "on" ; -- toP = mkPrep "to" ; -- +lin + here_Adv = ss (thbind "ที่นี่") ; + there_Adv = ss (thbind "ที่นั่น") ; + when_IAdv = ss (thbind "เมื่อไร") ; + how_IAdv = ss (thbind "อย่างไร") ; + all_Predet = ss (thbind "ทั้ง" "หมด") ; + many_Det = mkN (thbind "หลาย") ; + some_Det = mkN (thbind "บ้าง") ; + few_Det = mkN (thbind "สองสาม") ; + other_A = mkA (thbind "อื่น") ; +-- big_A = mkA (thbind "ใหญ่") ; + long_A = mkA (thbind "ยาว") ; + wide_A = mkA (thbind "กว้าง") ; + thick_A = mkA (thbind "หนา") ; + heavy_A = mkA (thbind "หนัก") ; + small_A = mkA (thbind "เล็ก") ; + short_A = mkA (thbind "สั้น") ; + narrow_A = mkA (thbind "แคบ") ; + thin_A = mkA (thbind "บาง") ; +-- woman_N = personN (thbind "หญิง") ; + man_N = personN (thbind "ชาย") ; +-- child_N = mkN (thbind "เด็ก") ; + wife_N = personN (thbind "เมีย") ; + husband_N = personN (thbind "ผัว") ; + mother_N = personN (thbind "แม่") ; + father_N = personN (thbind "พ่อ") ; + animal_N = animalN (thbind "สัตว์") ; + fish_N = animalN (thbind "ปลา") ; + bird_N = animalN (thbind "นก") ; + dog_N = animalN (thbind "หมา") ; + louse_N = animalN (thbind "เล็น") ; + snake_N = animalN (thbind "งู") ; + worm_N = animalN (thbind "หนอน") ; + tree_N = mkN (thbind "ไม้") ; + forest_N = mkN (thbind "ดง") ; + stick_N = mkN (thbind "กิ่ง") ; + fruit_N = mkN (thbind "หมาก") ; + seed_N = mkN (thbind "เม็ด") ; + leaf_N = mkN (thbind "ใบ") ; + root_N = mkN (thbind "ราก") ; + bark_N = mkN (thbind "เปลือก") ; + flower_N = mkN (thbind "ดอก") ; + grass_N = mkN (thbind "หญ้า") ; + rope_N = mkN (thbind "เชือก") ; + skin_N = mkN (thbind "หนัง") ; + meat_N = mkN (thbind "เนื้อ") ; + blood_N = mkN (thbind "เลือด") ; + bone_N = mkN (thbind "กระดูก") ; + fat_N = mkN (thbind "มัน") ; + egg_N = mkN (thbind "ไข่") ; + horn_N = mkN (thbind "เขา") ; + tail_N = mkN (thbind "หาง") ; + feather_N = mkN (thbind "ขน") ; + hair_N = mkN (thbind "ผม") ; + head_N = mkN (thbind "หัว") ; + ear_N = mkN (thbind "หู") ; + eye_N = mkN (thbind "ตา") ; + nose_N = mkN (thbind "จมูก") ; + mouth_N = mkN (thbind "ปาก") ; + tooth_N = mkN (thbind "ฟัน") ; + tongue_N = mkN (thbind "ลิ้น") ; + fingernail_N = mkN (thbind "เล็บ") ; + foot_N = mkN (thbind "เท้า") ; + leg_N = mkN (thbind "ขา") ; + knee_N = mkN (thbind "เข่า") ; + hand_N = mkN (thbind "มือ") ; + wing_N = mkN (thbind "ปิก") ; + belly_N = mkN (thbind "พุง") ; + guts_N = mkN (thbind "ไส้") ; + neck_N = mkN (thbind "คอ") ; + back_N = mkN (thbind "หลัง") ; + breast_N = mkN (thbind "นม") ; + heart_N = mkN (thbind "ใจ") ; + liver_N = mkN (thbind "ตับ") ; +-- drink_V2 = mkV2 (thbind "ดื่ม") ; + eat_V2 = mkV2 (thbind "กิน") ; + bite_V2 = mkV2 (thbind "กัด") ; + suck_V2 = mkV2 (thbind "ดูด") ; + spit_V = mkV (thbind "ถ่ม") ; + vomit_V = mkV (thbind "อ้วก") ; + blow_V = mkV (thbind "พัด") ; + breathe_V = mkV (thbind "หาย" "ใจ") ; + laugh_V = mkV (thbind "หัว" "เราะ") ; + see_V2 = mkV2 (thbind "เห็น") ; + hear_V2 = mkV2 (thbind "ยิน") ; +-- know_V2 = mkV2 (thbind "รู้") ; + think_V = mkV (thbind "คิด") ; + smell_V = mkV (thbind "มีก" "ลิ่น") ; + fear_N = mkN (thbind "กลัว") ; +-- sleep_V = mkV (thbind "นอน") ; + live_V = mkV (thbind "อยู่") ; + die_V = mkV (thbind "ตาย") ; + kill_V2 = mkV2 (thbind "ฆ่า") ; + fight_V = mkV (thbind "สู้") ; + hunt_V2 = mkV2 (thbind "ล่า") ; + hit_V2 = mkV2 (thbind "ตี") ; + cut_V2 = mkV2 (thbind "ตัด") ; + split_V2 = mkV2 (thbind "ผ่า") ; + stab_V2 = mkV2 (thbind "แทง") ; + scratch_V2 = mkV2 (thbind "เกา") ; + dig_V2 = mkV2 (thbind "ขุด") ; + swim_V = mkV (thbind "ว่าย") ; + fly_V = mkV (thbind "บิน") ; + walk_V = mkV (thbind "เดิน") ; + come_V = mkV (thbind "มา") ; + lie_V = mkV (thbind "นอน") ; + sit_V = mkV (thbind "นั่ง") ; + stand_V = mkV (thbind "ยืน") ; + turn_V = mkV (thbind "หัน") ; + fall_V = mkV (thbind "ตก") ; +---- give_V3 = mkV3 (thbind "ให้") ; + hold_V2 = mkV2 (thbind "อุ้ม") ; + squeeze_V2 = mkV2 (thbind "คั้น") ; + rub_V2 = mkV2 (thbind "ถู") ; + wash_V2 = mkV2 (thbind "ล้าง") ; + wipe_V2 = mkV2 (thbind "เช็ด") ; + pull_V2 = mkV2 (thbind "ดึง") ; + push_V2 = mkV2 (thbind "ผลัก") ; + throw_V2 = mkV2 (thbind "ขว้าง") ; + tie_V2 = mkV2 (thbind "ผูก") ; + sew_V2 = mkV2 (thbind "เย็บ") ; + count_V2 = mkV2 (thbind "นับ") ; +-- say_VS = lin VS (mkV (thbind "พูด")) ; + sing_V = mkV (thbind "ร้อง") ; + play_V = mkV (thbind "เล่น") ; + float_V = mkV (thbind "ลอย") ; + flow_V = mkV (thbind "ไหล") ; + freeze_V = mkV (thbind "แข็ง") ; + swell_V = mkV (thbind "ตุ่ม") ; + sun_N = mkN (thbind "ตะ" "วัน") ; + moon_N = mkN (thbind "เดือน") ; + star_N = mkN (thbind "ดาว") ; + water_N = mkN (thbind "น้ำ") ; + rain_N = mkN (thbind "ฝน") ; + river_N = mkN (thbind "แม่" "น้ำ") ; + lake_N = mkN (thbind "ทะ" "เล" "สาบ") ; + sea_N = mkN (thbind "ทะ" "เล") ; + salt_N = mkN (thbind "เกลือ") ; + stone_N = mkN (thbind "หิน") ; + sand_N = mkN (thbind "ทราย") ; + dust_N = mkN (thbind "ฝุ่น") ; + earth_N = mkN (thbind "ดิน") ; + cloud_N = mkN (thbind "เมฆ") ; + fog_N = mkN (thbind "หมอก") ; + sky_N = mkN (thbind "ฟ้า") ; + wind_N = mkN (thbind "ลม") ; + snow_N = mkN (thbind "หิมะ") ; + ice_N = mkN (thbind "น้ำ" "แข็ง") ; + smoke_N = mkN (thbind "ควัน") ; + fire_N = mkN (thbind "ไฟ") ; + ash_N = mkN (thbind "เถ้า") ; + burn_V = mkV (thbind "เผา") ; + road_N = mkN (thbind "ทาง") ; + mountain_N = mkN (thbind "เขา") ; + red_A = mkA (thbind "แดง") ; + green_A = mkA (thbind "เขียว") ; + yellow_A = mkA (thbind "เหลือง") ; + white_A = mkA (thbind "ขาว") ; + black_A = mkA (thbind "ดำ") ; + night_N = mkN (thbind "กลาง" "คืน") ; + day_N = mkN (thbind "กลาง" "วัน") ; + year_N = mkN (thbind "ปี") ; + warm_A = mkA (thbind "ร้อน") ; + cold_A = mkA (thbind "หนาว") ; + full_A = mkA (thbind "เต็ม") ; + new_A = mkA (thbind "ใหม่") ; + old_A = mkA (thbind "แก่") ; + good_A = mkA (thbind "ดี") ; + + bad_A = mkA (thbind "เลว") ; + rotten_A = mkA (thbind "เน่า") ; + dirty_A = mkA (thbind "สก" "ปรก") ; + straight_A = mkA (thbind "ดิ่ง") ; + round_A = mkA (thbind "กลม") ; + sharp_A = mkA (thbind "คม") ; + dull_A = mkA (thbind "ทื่อ") ; + smooth_A = mkA (thbind "ละ" "มุน") ; + wet_A = mkA (thbind "เปียก") ; + dry_A = mkA (thbind "แห้ง") ; + correct_A = mkA (thbind "แท้") ; + near_Adv = ss (thbind "ใกล้") ; + far_Adv = ss (thbind "ไกล") ; + } diff --git a/lib/src/thai/ParadigmsTha.gf b/lib/src/thai/ParadigmsTha.gf index fee3b63cb..0ac042478 100644 --- a/lib/src/thai/ParadigmsTha.gf +++ b/lib/src/thai/ParadigmsTha.gf @@ -18,6 +18,8 @@ oper = \s -> mkN s "คัน" ; houseN : Str -> N = \s -> mkN s "หลัง" ; + animalN : Str -> N + = \s -> mkN s "ตัว" ; mkA : Str -> A = \s -> lin A (mkAdj s) ; diff --git a/lib/src/thai/StructuralTha.gf b/lib/src/thai/StructuralTha.gf index 63bb64275..ce0e2a165 100644 --- a/lib/src/thai/StructuralTha.gf +++ b/lib/src/thai/StructuralTha.gf @@ -104,5 +104,25 @@ concrete StructuralTha of Structural = CatTha ** -- s = table Number [x ; y] -- } ; -- + +-- from Swadesh + here_Adv = ss (thbind "ที่นี่") ; + there_Adv = ss (thbind "ที่นั่น") ; + when_IAdv = ss (thbind "เมื่อไร") ; + how_IAdv = ss (thbind "อย่างไร") ; + all_Predet = ss (thbind "ทั้ง" "หมด") ; + many_Det = {s1 = thbind "หลาย" ; s2 = [] ; hasC = True} ; + some_Det = {s1 = thbind "บ้าง" ; s2 = [] ; hasC = True} ; + few_Det = {s1 = thbind "สอง" "สาม" ; s2 = [] ; hasC = True} ; + right_Ord = ss (thbind "ขวา") ; + left_Ord = ss (thbind "ซ้าย") ; + at_Prep = ss (thbind "ที่") ; + in_Prep = ss (thbind "ใน") ; + with_Prep = ss (thbind "กับ") ; +-- and_N = mkN (thbind "และ") ; + if_Subj = ss (thbind "ถ้า") ; + because_Subj = ss (thbind "เพราะ") ; + name_N = mkN (thbind "ชื่อ") ; + } diff --git a/lib/src/thai/src/MkLex.hs b/lib/src/thai/src/MkLex.hs new file mode 100644 index 000000000..3f216cf07 --- /dev/null +++ b/lib/src/thai/src/MkLex.hs @@ -0,0 +1,19 @@ +main = interact (unlines . map mkOne . lines) + +mkOne s = case tabs s of + _:eng:tha:_ -> mkEntry eng tha + _ -> "" + +tabs s = case break (=='\t') s of + ([], _:ws) -> tabs ws + (w , _:ws) -> w:tabs ws + _ -> [s] + +-- rough approximation of POS +mkEntry eng tha = unwords [" ",ident,"=",mk,def,";"] where + (ident,mk) = case words eng of + "to":w:_ -> (w ++ "_V", "mkV") + w:_ -> (w ++ "_N", "mkN") + def = "(thbind \"" ++ takeWhile (/=',') tha ++ "\")" + + diff --git a/lib/src/thai/src/swadesh.txt b/lib/src/thai/src/swadesh.txt new file mode 100644 index 000000000..53b7e7b94 --- /dev/null +++ b/lib/src/thai/src/swadesh.txt @@ -0,0 +1,209 @@ +-- http://en.wiktionary.org/wiki/Appendix:Thai_Swadesh_list, 7/11/2011 + +1 I ฉัน, กู chǎn, kuu +2 you (singular) เธอ, มึง thəə, mʉŋ +3 he เขา kháo +4 we เรา rao +5 you (plural) พวกคุณ phûakkhun +6 they พวกเขา phûakkháo +7 this นิ้ níi +8 that นั่น nán +9 here ที่นี่ thîinîi +10 there ที่นั่น thîinân +11 who ผู้ใด phûuday +12 what อะไร ?aray +13 where ที่ใด thîiday +14 when เมื่อไร mʉ̂aray +15 how อย่างไร yàaŋray +16 not ไม่ mây +17 all ทั้งหมด tháŋmòt +18 many หลาย lǎay +19 some บ้าง bâaŋ +20 few สองสาม sɔ̌ɔŋsǎam +21 other อื่น ?ʉ̀ʉn +22 one หนึ่ง nʉ̀ŋ +23 two สอง sɔ̌ɔŋ +24 three สาม sǎam +25 four สี่ sìi +26 five ห้า hâa +27 big ใหญ่, โต yày, too +28 long ยาว yaaw +29 wide กว้าง kwâaŋ +30 thick หนา nǎa +31 heavy หนัก nàk +32 small เล็ก, น้อย lék, nɔ́ɔy +33 short สั้น, เตี้ย sân, tîa +34 narrow แคบ khâeaep +35 thin บาง baaŋ +36 woman หญิง yǐŋ +37 man (adult male) ชาย chaay +38 man (human being) ผู้, คน phûu, khon +39 child เด็ก, ศิศุ dèk, sìsù +40 wife เมีย, ภรรยา mia, phanrayaa +41 husband ผัว, สามี phǔa, sǎamii +42 mother แม่ mâeae +43 father พ่อ, บิดา phɔ̂ɔ, bìdaa +44 animal สัตว์ sàt +45 fish ปลา plaa +46 bird นก; วิหค (Sanskrit) nók, wíhòk +47 dog หมา; สุนัข (Sanskrit) mǎa, sùnák +48 louse เล็น, เหา len, hǎo +49 snake งู ŋuu +50 worm หนอน nɔ̌ɔn +51 tree ไม้ máay +52 forest ดง, ป่า doŋ, pàa +53 stick กิ่ง kìŋ +54 fruit หมาก màak +55 seed เม็ด mét +56 leaf ใบ bay +57 root ราก râak +58 bark (of a tree) เปลือก, ผิว plʉ̀ak, phǐw +59 flower ดอก, ปลี dɔ̀ɔk, plii +60 grass หญ้า yâa +61 rope เชือก chʉ̂ak +62 skin หนัง nǎŋ +63 meat เนื้อ nʉ́a +64 blood เลือด, โลหิต lʉ̂at, loohìt +65 bone กระดูก, ก้าง kradùuk, kâaŋ +66 fat (noun) มัน man +67 egg ไข่ khày +68 horn เขา khǎo +69 tail หาง hǎaŋ +70 feather ขน khǒn +71 hair ผม phǒm +72 head หัว hǔa +73 ear หู hǔu +74 eye ตา taa +75 nose จมูก camùuk +76 mouth ปาก pàak +77 tooth ฟัน fan +78 tongue (organ) ลิ้น lín +79 fingernail เล็บ lép +80 foot เท้า, ตีน tháaw, tiin +81 leg ขา khǎa +82 knee เข่า khào +83 hand มือ mʉʉ +84 wing ปิก pìik +85 belly พุง phuŋ +86 guts ไส้ sây +87 neck คอ, ศอ khɔɔ, sɔ̌ɔ +88 back หลัง lǎŋ +89 breast นม nom +90 heart ใจ cay +91 liver ตับ tàp +92 to drink ดื่ม dʉ̀ʉm +93 to eat กิน kin +94 to bite กัด kàt +95 to suck ดูด dùut +96 to spit ถ่ม, คาย thòm, khaay +97 to vomit อ้วก, อาเจียน ?ûak, ?aacian +98 to blow พัด phát +99 to breathe หายใจ hǎaycay +100 to laugh หัวเราะ hǔarɔ́ +101 to see เห็น hěn +102 to hear ยิน, ฟัง yin, faŋ +103 to know รู้ rúu +104 to think คิด khít, ?àan +105 to smell มีกลิ่น miiklìn +106 fear กลัว, ยั่น klua, yân +107 to sleep นอน nɔɔn +108 to live อยู่, อาศัย yùu, ?aasǎi +109 to die ตาย, วาย taay, waay +110 to kill ฆ่า, มล้าง khâa, maláaŋ +111 to fight สู้, รบ sûu, róp +112 to hunt ล่า lâa +113 to hit ตี tii +114 to cut ตัด, บาด tàt, bàat +115 to split ผ่า phàa +116 to stab แทง, เสียบ thaeaeŋ, sìap +117 to scratch เกา kao +118 to dig ขุด khùt +119 to swim ว่าย wâay +120 to fly บิน bin +121 to walk เดิน dəən +122 to come มา maa +123 to lie (as in a bed) นอน nɔɔn +124 to sit นั่ง nâŋ +125 to stand ยืน yʉʉn +126 to turn (intransitive) หัน hǎn +127 to fall ตก, หล่น tòk, lòn +128 to give ให้ hây +129 to hold อุ้ม ?ûm +130 to squeeze คั้น khán +131 to rub ถู, นวด thǔu, nûat +132 to wash ล้าง láaŋ +133 to wipe เช็ด chét +134 to pull ดึง, ลาก dʉŋ, lâak +135 to push ผลัก phlàk +136 to throw ขว้าง, ปา khwâaŋ, paa +137 to tie ผูก, ล่าม phùuk, lâam +138 to sew เย็บ yép +139 to count นับ náp +140 to say พูด, บอก phûut, bɔ̀ɔk +141 to sing ร้อง rɔ́ɔŋ, khàp +142 to play เล่น lên +143 to float ลอย lɔɔy +144 to flow ไหล lǎy +145 to freeze แข็ง khǎeŋ +146 to swell ตุ่ม tùm +147 sun ตะวัน; พระอาทิตย์ (Sanskrit) tawan, phrá?aathít +148 moon เดือน; พระจันทร์ (Sanskrit) dʉan, phrácan +149 star ดาว; ดารา (Sanskrit) daaw, daaraa +150 water น้ำ; ชล (Sanskrit) náam, chon +151 rain ฝน fǒn +152 river แม่น้ำ, นที (Sanskrit) mâenáam, náthii +153 lake ทะเลสาบ thaleesàap +154 sea ทะเล; มหาสมุทร (Sanskrit) thalee, mahǎasamùt +155 salt เกลือ klʉa +156 stone หิน hǐn +157 sand ทราย saay +158 dust ฝุ่น; ธุลี (Sanskrit) fùn, thúlii +159 earth ดิน din +160 cloud เมฆ mêek +161 fog หมอก mɔ̀ɔk +162 sky ฟ้า, นภา fáa, napā +163 wind ลม lom +164 snow หิมะ himá +165 ice น้ำแข็ง náamkhǎeŋ +166 smoke ควัน khwan +167 fire ไฟ, อัคนี fay, akkhanii +168 ash เถ้า thâo +169 to burn เผา phǎo +170 road ทาง, หน thaaŋ, hǒn +171 mountain เขา, ภู, ดอย, คิริ phuu, khǎo, dɔɔy, khìrì +172 red แดง daeaeŋ +173 green เขียว khǐaw +174 yellow เหลือง lʉ̌aŋ +175 white ขาว khǎaw +176 black ดำ dam +177 night กลางคืน klaaŋkhʉʉn +178 day กลางวัน klaaŋwan +179 year ปี,ขวบ pii, khùap +180 warm ร้อน, อุ่น rɔ́ɔn, ?ùn +181 cold หนาว, เซ็ง nǎaw, sen +182 full เต็ม tem +183 new ใหม่ mày +184 old แก่, เฒ่า kàeae, thâo +185 good ดี dii +186 bad เลว, ร้้าย leew, ráay +187 rotten เน่า nâo +188 dirty สกปรก sòkkapròk +189 straight ดิ่ง, ตรง dìŋ, troŋ +190 round กลม, มน klom, mon +191 sharp (as a knife) คม khom +192 dull (as a knife) ทื่อ thʉ̂ʉ +193 smooth ละมุน lamun +194 wet เปียก pìak +195 dry แห้ง hâeaeŋ +196 correct แท้, แม่น tháeae, mâeaen +197 near ใกล้ klây +198 far ไกล klay +199 right ขวา khwǎa +200 left ซ้าย sáay +201 at ที่ thîi +202 in ใน nay +203 with กับ, ด้วย kàp, dûay +204 and และ láe +205 if ถ้า, เผื่อ thâa, phʉ̀a +206 because เพราะ, ด้วย phrɔ́, dûay +207 name ชื่อ, เรียก chʉ̂ʉ, rîak