看板 Ancient 關於我們 聯絡資訊
※ [本文轉錄自 Gossiping 看板 #1WJC77Ti ] 作者: mayaman ( 馬雅人) 看板: Gossiping 標題: Re: [問卦] 機器學習有可能讓我們懂馬雅文嗎 時間: Sat Mar 13 21:44:35 2021 ※ 引述《Firstshadow (凱留醬><")》之銘言: : 嗨嗨 : 大家晚上好壓壓ka~ : 就是喇 : 小魯弟妹窩最近在接觸自然語言 : 發現 : 每個語文都有一套自己標準的架構 : 而馬雅文也被證明不是圖惹 而是象形文字 : 這樣的話 : 運用現代的技術 : 有可能用那個什摸機器學習什麼的大數據還有AI : 來讓我們更深入了解馬雅文嗎 == : 畢竟小魯弟妹窩 從小開始 : 玩世紀帝國、世紀帝國2 都選馬雅人噠 : 所以蠻想懂噠 : so, 有沒有機器學習有沒有可能讓我們懂馬雅文的八卦ㄋ~ : わたし、気になります~ : http://i.imgur.com/n1VzFhV.jpg
: (づ′・ω・)づ ~ 你說的這個問題,我蠻有興趣的。 因為,學會馬雅文字一直是我從小的夢想。 所以我自學,也花錢到國外請教最厲害的學者。 目前已經略有小成,也開課教一些社會人士解讀的方法啦。 其實馬雅文字不是特別容易,除非長期接觸,否則也不是很好懂。 所以,我還蠻期待可以用機器學習的方式來解讀馬雅文字。 我自己不太懂機器學習的界線跟極限是什麼? 因此這篇文,我想要講一下馬雅文字解讀的幾個困難處。 再請懂機器學習或是AI的鄉民們,評估看看是不是有辦法。 就看看是我教你比較快,還是教會機器比較快啦 第一點! 瑪雅文字不是純粹的象形文字,一個馬雅文字可以有三種基本型態。 分別是純象形、表音、象形混合表音的型態。有些人會用中文的六書 來理解,但是本人覺得還是有些差異,所以不太喜歡用六書來解釋。 關於這點,我舉「Pakal」(盾牌)的三種型態寫法。 https://imgur.com/rOSStB0 從我整理的這個圖片,就可以看到一個字基本上有三種不同型態的寫法。 而且,這三種書寫型態沒有規則,完全按照書寫者當下的決定。 這個是解讀的第一個最簡單的困難。 第二點! 瑪雅文字有些特殊分類的馬雅文字。像是曆法類的文字,就沒有不同型態的問題。 馬雅主要有三種曆法,其餘的曆法種類零零總總則不超過十種。網路上有些馬雅 曆法能量的學派說有二十種或是三十種,其實是亂說。 常用的三種曆法是長紀年曆、哈布曆、卓爾金曆。後兩種,我在YT上有拍影片, 可以自己參考一下,長紀年曆的影片配合末日預言,最近要拍。 https://youtu.be/hN8UxBspa8I
這類文字比較簡單,比較有規律。所以也是最早被破解的馬雅文字。 我想要機器學習比較簡單。 第三點! CVC原則 瑪雅文字既然可以拼音,所以那些像是圖案的字符,可以表示語音。 不過,馬雅文跟日文有點像,一個音節用一個字符表示。但是馬雅語的語尾卻 會以子音結尾。因此,如果語言要書寫成文字,就要寫成補一個母音,行成音 節。 母音有A、E、I、O、U五個。要補充哪個音節,大多數狀況由前一個音節的母音 決定。像是第一點提到的Pakal,寫成拼音型態時,結尾是子音L。 因此,前一個音節是Ka,所以寫成拼音型文字時,結尾要補上A這個音。 Pakal(a),但是唸出來時A不發音。 但是,瑪雅文字並不是嚴格遵照CVC原則的,雖然有些原則可以依循,不過, 還是要看書寫者的選擇,也有可能結尾母音與前一個音節的母音不同的情形。 第四點! 字符變換原則 這點在我的教學經驗裡,算是比較困難的。 瑪雅文字是沒有統一跟固定的寫法的。前面提到三種類型的字。 基本上都會因為寫作者的寫法,而產生無限多種變化。 在象形型態的文字中,有可能出現幾個重要的辨識點,再加上許多讓人與其他字 混淆的變化。所以,如果要解讀,就是要神入馬雅人的心態跟文化脈絡。 另外,同樣的情形也會混在表音兼象形型態的情形裡,例如下面這個例子 https://imgur.com/xjKlm3h 以上這些字都代表yotoot,某人某地的房子。 而且不是全部的寫法,只是其中一個部分。 在拼音型文字中,則是每個音節都會有許多不同的寫法。 這個就是我去美國學習的老師David Stuart在18歲時候發現的規則。 字符變換原則。 例如Na這個音節,可以有以下的各種寫法 https://imgur.com/tVbCrpv 至於何時出現,一樣沒有規則,按照書寫者當時的設計。 如果是個三個音節的字,每個音節有三種寫法,可能會有27種可能性。 第五點 各種融合原則 理論上馬雅文字是一個方塊,每個方塊可以代表一個單詞,也可以代表兩個單詞。 甚至也有前半部分是前一個字後半部分的音節,後半部分是後面一個字的前半部分 音節。 又還有不同字詞可以融合的。 像是Chum、Tun這兩個單字,可以融合成一個字。 如果中規中矩的寫法是這樣 https://imgur.com/8nz2zhu 前半部分是Chum,後半部分是Tun 但是也可以融合成這樣。 https://imgur.com/r01M6Ke 把Chum 跟 Tun融合成一個字符。 同樣的,配合字符變換原則,也可以變化出很多種不同的寫法。 但是最炸鍋的事情是,這五個原則都會混在一起發生。 而且沒有規律 以上,大概就是這五點,請大家再評估一下。 我之前有開直播簡單講過,也歡迎大家參考。 https://youtu.be/2KrMWU6J6E4
-- 馬雅國徵募僑民中: https://www.facebook.com/mayaman5566/ 馬雅正統官媒 Youtube 頻道 https://youtu.be/JYTCDY_q6ho
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.154.158 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1615643079.A.76C.html
OGCOGCOGCOGC: 推 03/13 21:44
※ 編輯: mayaman (111.248.154.158 臺灣), 03/13/2021 21:45:32
gasbo: 投 03/13 21:44
yahoody: 推 03/13 21:44
bruce1119: 搶前排! 03/13 21:45
matt40413: 好前面!! 03/13 21:45
revorea: 未看先推馬雅人 03/13 21:45
xpsecret: 看不懂啦== 03/13 21:45
※ 編輯: mayaman (111.248.154.158 臺灣), 03/13/2021 21:46:23
rapnose: 推。 03/13 21:46
Hirano: 這樣都能釣XDDDD 03/13 21:46
joumay: Pakal 後a不發音 是唸 趴口? 03/13 21:46
是的 ※ 編輯: mayaman (111.248.154.158 臺灣), 03/13/2021 21:47:44
keroro39: 這就是人類的極限了吧,那我們沒辦法知道發音對吧 03/13 21:47
當然可以,我們可以知道瑪雅語的發音
FlyingShark: 先留名好了 03/13 21:47
abc0922001: 機器學習可以針對上下文去判斷用什麼翻譯 03/13 21:47
※ 編輯: mayaman (111.248.154.158 臺灣), 03/13/2021 21:48:35
mvpdirk712: 真強 自學到這樣............ 03/13 21:48
abc0922001: 但前提是需要有高品質的資料去學習 03/13 21:48
inunoya: 現在推 娘子快出來看上帝都會想到達叔 03/13 21:48
akarl115: 推 03/13 21:48
phyBomber: 先推 晚點再慢慢看 03/13 21:48
qq0101889: 百推內 03/13 21:48
sofaman: 原來如此,跟我想的一樣 03/13 21:49
s8402019: 推 03/13 21:49
※ 編輯: mayaman (111.248.154.158 臺灣), 03/13/2021 21:49:57
bhshin: 找國內做NLP的lab說不定可以申請個科技部計畫經費,近期 03/13 21:49
rererere147: 恩 好 你還是教機器吧 03/13 21:49
bhshin: 科技部AI相關領域有注重人文方面的應用 雖然不知道馬雅文 03/13 21:49
keroro39: 哇好神奇... 還是不懂為什麼可以 03/13 21:49
bhshin: 化會不會算在裡面就是了- - 03/13 21:49
Doub1eK: 我承認我看不懂 03/13 21:49
jschenlemn: 語系有傳承的話可以用現代的回去推 03/13 21:50
happydaan: 先推 03/13 21:50
jschenlemn: 因為什麼詞代表甚麼意思應該會有傳承與關聯 03/13 21:50
jschenlemn: 那麼就有機會用深度學習的方法去搞搞看 03/13 21:50
morgankhs: 百推 03/13 21:51
karasuxx: 哇塞百推誒 03/13 21:51
mayaman: 是的~我們是用現代瑪雅語去復原古代的瑪雅語的 03/13 21:51
gogocar: 百推內 03/13 21:51
horsetail: 成功釣到 XDD 03/13 21:51
joy159357: 卡 03/13 21:51
sugoi5566: 百推內 03/13 21:51
nvalue: 推 03/13 21:52
Cwren: 推推 03/13 21:52
hogu134: 聽說搭配放大器效果更好百推內 03/13 21:52
jschenlemn: ㄟ那確實有搞頭耶... 資料量應該也夠大 03/13 21:52
gherkinya: 推 03/13 21:52
roalan8188: 百推內 03/13 21:52
hogu134: 幹 推錯文 03/13 21:52
diabolica: 百推內 03/13 21:52
jjaacky: 瑪雅! 03/13 21:53
jschenlemn: 不過沒有GOLD STANDARD會比較麻煩 03/13 21:53
shangguan125: 推 03/13 21:53
kch978: 百推內 03/13 21:53
NgJovi: 你不要教我這麼多 教我一句罵人的就好 03/13 21:53
dxdy: 閱 03/13 21:55
as52341: 百推! 03/13 21:55
ToTaiwan: 推 03/13 21:55
chh1470: 推 03/13 21:55
assidiot: 推馬雅人! 03/13 21:56
devilfruit: 馬雅人回了 03/13 21:56
wcmwcm: 大使好! 03/13 21:57
p907018: 推 03/13 21:57
lovefriend: 推 03/13 21:57
kylecheng25: 真好奇馬雅人罵人最惡毒的話是什麼 03/13 21:58
rial: 推 03/13 21:58
beving: 推! 03/13 21:58
nightyao: 第一點不就對照中文的象形、指事、會意、型聲 03/13 21:58
milkBK: 可以參考異星入境這個電影 03/13 21:59
phoneing: 推推 03/13 21:59
slovea: 推 03/13 21:59
tytyblack: 媚修桿魔 怎麼寫 03/13 21:59
kenco: 就像AlphaGO一樣,AI的能耐取決於它背後的設計團隊 03/13 21:59
mayaman: 我忘記講還有文法變化XDD 03/13 22:00
rockieloser: 太神啦 03/13 22:00
kusoeni: 百推內 03/13 22:00
jeffwang0110: 推 03/13 22:00
winstonuno: 推 03/13 22:01
Julibea: 先推再看 03/13 22:01
TRod: 推 03/13 22:01
kensuke0117: 百推內 03/13 22:02
daae: 太專業了 語言白癡不懂 03/13 22:02
zxc17893: 推推推 03/13 22:03
Csongs: 怎知自己解讀對不對? 03/13 22:03
jacky336: 推 03/13 22:03
jackwula9211: 有邏輯的東西就有搞頭,但設計邏輯訓練的人要先搞 03/13 22:03
jackwula9211: 懂馬雅文這點比較難 03/13 22:03
fmatt: 推 03/13 22:03
a7749daya: 推 03/13 22:04
aa429: 推 03/13 22:04
Csongs: 發音也是 有文獻記錄怎發音嗎@@ 03/13 22:05
staristic: 看起來很困難…怎麼會搞出這種文字系統… 03/13 22:05
johnwu: 有沒有你最近很好釣的八卦啊 XDDD 03/13 22:06
peterliam: 馬雅人我就是推啦 03/13 22:06
LierX: 推 03/13 22:07
brolli: 推 03/13 22:07
vulpecula: 推 03/13 22:07
lightbox: 推! 竟然有人會 03/13 22:08
wdnm3444: 百推內~ 03/13 22:08
hvariables: 這個最終還是得靠有智慧的人去解讀沒辦法靠程式硬算 03/13 22:08
lightbox: 更正 推 竟然有人會噓馬雅人 03/13 22:09
See3Children: 百推內 03/13 22:09
psypoorer: 推 03/13 22:09
scott123321: 推啊! 03/13 22:09
fm06qup3m4: 推 03/13 22:09
sexdriver: 推 03/13 22:10
cka: 期待有天google翻譯可以支援瑪雅文 03/13 22:13
becca945: 現代馬雅人 03/13 22:13
eineFrage: Wow... 03/13 22:14
jokethelife: 文字系統複雜又沒有嚴格明確的規律是因為早期剛發展 03/13 22:15
jokethelife: 文字所以不完全的關係嗎?還是因為現今能解讀的資料 03/13 22:15
jokethelife: 不夠? 03/13 22:15
diiky: 推 03/13 22:15
tiltheday: 推馬雅人 03/13 22:18
sheepmeamea: 可以私信你我本名幫翻瑪雅文嗎XD 03/13 22:18
blowchina: 你說的我都懂 只是文中影片的縮圖為什麼是4x貓?? 03/13 22:19
Tassatul: @@ 03/13 22:19
windsson: ID正確 03/13 22:24
greedystar1: 看來我學不懂瑪雅文了 我連看你解釋都卡住了QQ 03/13 22:24
daniel50508: 推 03/13 22:24
Domineering: 這太難了吧 03/13 22:25
ching620: 馬雅人~~~~ 03/13 22:25
Aotearoa: 都過半個小時了還沒爆,八卦板怎麼了 03/13 22:25
seiyu1989: 雖然看不懂還是推! 03/13 22:26
GonVolcano: 不止釣到還引起興趣,狂! 03/13 22:28
os369: 百推推推推推推 03/13 22:30
reed0huang: 感覺只要能把每個字tokenize就有辦法用NLP的方法處理 03/13 22:31
reed0huang: 了 03/13 22:31
q77777892: 馬雅人先推就對了 03/13 22:33
ckid: 推 03/13 22:34
a122771723: 推 03/13 22:34
Firstshadow: 可以喇 但現在最簡單的方式是 03/13 22:36
Firstshadow: 你需要把你所認識的所有單詞 或是句子 翻譯 03/13 22:36
Firstshadow: 翻成中文都可,然後要有文字替代馬雅圖(文字) 03/13 22:37
Lyrix: 推 03/13 22:37
purple0928: 太優質了吧 03/13 22:38
kendiv: 老實說文字寫法這麼多種 馬雅人自己學習也很困難吧 03/13 22:38
Firstshadow: 之後就能扔進去train了 == 03/13 22:38
Firstshadow: 畢竟現在的演算法 對文字的結構已經是能造你前後文 03/13 22:38
pig0516: 推! 03/13 22:38
bryantmonkey: 推 03/13 22:38
Firstshadow: 的對應 去知道那個字(圖)的意思代表什摸 03/13 22:39
van2037: 推爆阿 03/13 22:40
eddy12357: 神 03/13 22:42
YoGlolz: 怎麼沒有爆 03/13 22:47
notneme159: 馬雅人給推 03/13 22:48
ted8833000: 推 03/13 22:53
BABY19831016: 瑪雅神 03/13 22:53
catlady: 感覺也太隨性可愛了 03/13 22:53
starlitfish: 認真 03/13 22:56
azzc1031: 這大概要用deep learning 了 03/13 22:58
shadowdio: 滾動~ 03/13 22:59
dnkofe: 你們有考慮過年代的不同嗎?例如中文的象形文字其實不同朝 03/13 23:02
dnkofe: 代不太相同,會不會瑪雅文也一樣有分朝代所以不同 03/13 23:02
badface: 推推 03/13 23:06
rexx0520: 這什麼鬼文字 03/13 23:07
BRANFORD: 學問龐大 03/13 23:08
kiuygtde: 推 03/13 23:08
Sacral: 覺得訓練模型的人腦袋會先星爆 03/13 23:08
jay0215: 看到瑪雅文字後 忽然覺得英文日文韓文泰文好像沒那麼難了 03/13 23:09
inpin: 太難了 03/13 23:10
KhePri: 應該跟外國人看到中文感覺差不多吧 太多要記了 03/13 23:11
FJHS: 真不太好懂XD 03/13 23:13
saedn: 這篇感覺很有趣 期待後續進度 03/13 23:13
bigmorr: 其實看不太懂 但還是先推w 03/13 23:14
GivemeApen: 推瑪雅人 03/13 23:14
yu800910: 推 03/13 23:17
yureca: 這文字也太不文字了 書寫應該很費時吧... 03/13 23:17
yu800910: 故意設計很難書寫跟閱讀,才能確保僧侶跟貴族的優越性 03/13 23:20
cvb123456789: 推 03/13 23:20
yu800910: 就跟甲骨文,以前也是只有貴族跟巫師才看得懂 03/13 23:20
takuya1: 推 03/13 23:22
palapalanhu: 難 03/13 23:24
gipo776: 推 03/13 23:24
bbenson: 推 03/13 23:25
banrifpb: 好難啊...... 03/13 23:28
bronzkof: 看來教機器好了(一臉茫然) 03/13 23:28
efkfkp: 瑪雅人民是不是各個都是從小美術一百分阿?每個字都像畫一 03/13 23:28
efkfkp: 張圖一樣,你給我一篇瑪雅文字叫我抄寫,我不一定能畫的出 03/13 23:29
efkfkp: 來欸XD 03/13 23:29
ringal: 難爆的感覺 03/13 23:30
soulknight: 推 03/13 23:31
Kokoro: 瑪雅人如果沒有畫圖天份寫不了字欸 當瑪雅人好難 03/13 23:33
kdy: 只要是人腦能理解的,電腦就能程式化 03/13 23:42
iamstrapless: 每次看沒錯都覺得屌 03/13 23:42
tim5201314: 幫推 03/13 23:43
THE6: 你....很猛 03/13 23:43
jjjohnny1282: 太扯,不歸律根本沒法玩 03/13 23:47
wayneduke: 推 03/13 23:47
zjing: 推 03/13 23:48
iiyu: 為什麼這麼複雜的文字系統書寫者們仍能看得懂彼此在寫什麼! 03/13 23:52
iiyu: 實在很厲害。 03/13 23:52
pxycho: 我無法理解...都不規律要怎麼解讀甚至書寫... 03/13 23:53
xhung: 要有夠多的已知文字才好training機器學習 規律非必備 03/13 23:54
q123212: 好 看不懂 03/13 23:58
Wangdy: 瑪雅文有羅塞塔石碑嗎? 03/13 23:58
Wangdy: 不然怎麼去猜他的意義? 03/13 23:59
FuwafuwaCAT: 好 03/14 00:00
aegisWIsL: 推 03/14 00:05
RLH: 好厲害 03/14 00:08
ww770829: 你很適合做研究! 03/14 00:10
edman008ptt: 這 沒有固定的怎搞 03/14 00:14
adsop: 推 03/14 00:16
cat0218: 超強 03/14 00:17
j111480: 也太難了... 03/14 00:19
wind: 這也他媽太難!!已曾沒人會講的文字可以知道發音?好厲害! 03/14 00:20
linja: 哇靠也太多隨機規則,這些字該不會只有寫的人自己看得懂吧 03/14 00:22
jamfly: 有興趣的話可以私信我 我目前在做語音還有文字的機器翻譯 03/14 00:28
jamfly: 研究 如果有平行語料的話 就有機會可以讓 AI 讀懂馬雅文 03/14 00:28
girafa: 超難啊 03/14 00:36
DarkIllusion: 感覺好難QQ 03/14 00:47
JH10: 用瑪雅文字寫作文會不會寫到天亮都寫不完XD? 03/14 00:54
Lebrono: 試試看才知道 03/14 01:02
freedom0116: 推 03/14 01:04
k47100014: 在我看來都是沒有邏輯沒有規律的塗鴉 能研究真的很強 03/14 01:07
hyd789: 瑪雅文字是在畫畫吧 03/14 01:10
tw11509: 推,會不會學通靈比較快XD 03/14 01:31
rickphyman42: 先推再看 03/14 01:36
CiCha: 推 03/14 01:49
paxetin: 收藏 03/14 01:54
tomap41017: 前提是要有許多資料集呀 03/14 02:19
weilsea: peko 03/14 02:30
gcfs1597: 推 03/14 02:43
cool9203: data夠多或許在有資料紀錄的情況裡。機器學習有機會學 03/14 02:45
cool9203: 習成功,但若不曾出現的例子,機器學習應該是無法學習 03/14 02:45
cool9203: 成果,這時就需要人工來判斷了 03/14 02:45
houjay: 文字的AI是有,但不知道瑪雅這麼複雜的規則可不可以套,但 03/14 03:14
khakibye: 有沒有可能就真的是固定的,不同的圖案就真的是不同字 03/14 03:14
houjay: 中文也很難應該還是可以吧 03/14 03:14
oginome: 瑪雅~媽呀~馬雅人~ 03/14 03:27
streakray: 推推 03/14 03:58
lulocke: 會不會不同地區的馬雅人因為口音腔調不同 就寫不同字呀 ? 03/14 04:03
lulocke: 像大家寫三小 啥小 殺洨 三洨 03/14 04:05
ypps950100: 純推不看 03/14 05:33
qaz12453: 哇塞線上開班授課喔 猛... 03/14 06:00
sample: 百推內原來那麼難 03/14 06:12
hizuki: 識別是圖像識別問題,翻譯就是NLP領域了 03/14 06:47
cyanineeeee: 推推 03/14 06:54
haleyye: 還沒實作但難度應該超高...要先學習影像辨識的部分,再認 03/14 07:11
haleyye: 讀語言...比中文還搞 03/14 07:11
leokind: 朝聖推 03/14 07:57
Jay915: 推 03/14 08:18
milfguy: 太神啦 03/14 08:55
chinsong: 明明是中文我卻看不懂 03/14 09:05
kapiXRZSY: 有馬雅人就推 03/14 09:49
honey4617912: 馬雅人個性還真藝術家 我想寫啥自創都可以 03/14 10:04
basslife: 不知道google有沒有興趣搞這個w 03/14 10:21
gary1198: 有些字長得好可愛 03/14 10:47
ericjc: 比中文還複雜呀呀呀 03/14 11:36
StevoWu: 推 03/14 12:07
MADAOTW: 推 03/14 12:19
kantantantan: 03/14 13:29
abb123456: 推 03/14 13:46
XDDDpupu5566: 馬雅人越來越像四叉兄弟 03/14 15:15
mystage: 就我的認知,AI學瑪雅文有兩種方式,一種可能比人類強, 03/14 15:23
mystage: 一種不會比較強。如果AI只學瑪雅文,那麼一定比現在的人 03/14 15:23
mystage: 類水準低。但是如果AI是學通用語言,順便學瑪雅文,那就 03/14 15:23
mystage: 可能依語言間的共同習慣,比人類找到更多的規律 03/14 15:23
mystage: 如果有AI能辦到跨語言的學習,我想一定是Google 03/14 15:25
※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: mayaman (36.229.123.160 臺灣), 03/14/2021 16:44:23
kevin0727a: 瑪雅文字有辦法手寫嗎 03/15 07:51
mayaman: 手寫應該沒問題吧 03/16 19:54
titiong: 佩服! 03/23 12:31
MilchFlasche: 好厲害,爆炸難 03/26 11:53
infinita: 推 07/28 12:26