看板 TW-language 關於我們 聯絡資訊
※ 引述《shyuwu (El Cid)》之銘言: : 標題: Re: [請教] 創造台語文字 : 時間: Thu Apr 13 23:50:19 2023 : : 兩三冬前,我開始耍人工文字,形式是母音附標,無佮聲調 : : https://i.imgur.com/IPkuwh9.jpg
: : 即嘛來共改做諺文,閣佮聲調 : : https://imgur.com/a/VBTcdwH : : 春曉例文 : : https://imgur.com/a/eUWfK5t : : 罔耍罔參考 : : : : -- : ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.189.100 (臺灣) : ※ 文章網址: https://www.ptt.cc/bbs/TW-language/M.1681401021.A.D3E.html : → lorena409: 第一張像盧恩符文XDDD 04/13 23:56 : → shyuwu: 盧恩XD 我兮原始設計毋是字母,是母音附標,愛去看這綰主 04/13 23:59 : → shyuwu: 題頂一篇兮推文兮圖啦 04/13 23:59 : ※ 編輯: shyuwu (42.79.189.100 臺灣), 04/14/2023 07:38:46 : → saram: 聲調一定要有.漢語的注音用字,沒標示聲調,等於自由唱歌了. 04/14 08:15 : → shyuwu: 原始設計毋是為著台語,是人工語言。到遮著牽了較遠去矣 04/14 08:19 : ※ 編輯: shyuwu (42.75.110.211 臺灣), 04/14/2023 14:47:47 : → saram: 人工語言到最後會成生活語言.如果經得起考驗的話. 04/14 23:24 : → tbrs: 不過文字這種東西從來都是人工的 04/15 02:27 : → shyuwu: 社會自然發展出來,交人為發明兮,總是無仝。韓國字著是 04/15 08:24 : → shyuwu: 上好兮例,北美兮惹拉義 (切洛基) 嘛是發明兮,可能閣影 04/15 08:24 : → shyuwu: 響著西非誠濟文字發明 04/15 08:24 : 推 MilchFlasche: 某人是不是幫幫忙一下,「人工語言」和創造文字怎麼 04/16 20:58 : → MilchFlasche: 會一樣???又在那邊語、字不分了 04/16 20:58 : → MilchFlasche: 然後人造語言指的是像esperanto這種 04/16 20:59 : → MilchFlasche: 或是Klingon、Quenya這種,除了愛好者小圈子外, 04/16 21:00 : → MilchFlasche: 不會變生活語言;所謂日久會形成新語言的, 04/16 21:00 : → MilchFlasche: 是creole混合語,例如海地語,或青海五屯話, 04/16 21:00 : → MilchFlasche: 或寒溪語,這些才真的是生活用語。嘛幫幫忙! 04/16 21:01 : → MilchFlasche: @all:創造文字系統是每個人都可以做的, 04/16 21:09 : → MilchFlasche: 「人工」兩字可以拿掉,因為書寫系統何嘗不是人造的 04/16 21:09 : → MilchFlasche: 歡迎多po多交流。我20年前研究所時上課也偷畫擴充式 04/16 21:10 : → MilchFlasche: 諺文來寫鶴+客+華語,但或許像這兩天大家po的, 04/16 21:11 : → MilchFlasche: 大刀闊斧全改,設計起來比較不會被舊系統綁住 04/16 21:11 : → MilchFlasche: 不過不管諺文或字喃/西夏文,因為都是一音節一方塊 04/16 21:12 : → MilchFlasche: 字符太多,對Unicode制訂和字型製作都是一大挑戰哦 04/16 21:12 : → MilchFlasche: 紙上畫畫或是用電腦繪圖還可以。有興趣就加油囉 04/16 21:13 : 推 tbrs: 原來人工智慧時代了 這符號的難打老問題還是難以解決 04/16 21:15 : → MilchFlasche: 因為要進入國際通用標準就曠日廢時 04/16 21:17 : → MilchFlasche: 而且就算是前電腦的活字時代,這麼多字符你也是得花 04/16 21:17 : → MilchFlasche: 大錢(開足濟錢)請工坊鑄幾萬個活字(那也是font) 04/16 21:18 : → shyuwu: 國際統一碼有字符,嘛有附加符號,欲鬥一个音節應該是無 04/17 15:11 : → shyuwu: 遐困難矣 04/17 15:11 愛看字骨(font,字型)。 這馬我所知影大部分會使共附加符號(combining diacritic marks) 好好勢勢囥到其他字符面頂个, 上主流猶閣是羅馬字个字骨。 因為,鬥起來个時陣,附加符號个位置愛倚左爿幾若點(pt)?、倚面頂幾若點? 相對位置攏愛設計過。 附加到羅馬字面頂个效果,佮附加到 Hangul 面頂个效果, 猶是愛試看覓。 若有儂試出來可行个組合方式、有理想个字骨,歡迎分享。 : → shyuwu: 是講古早文字因為毋知是啥人、抑是一陣人有意識創造、改 04/17 15:29 : → shyuwu: 編兮全新系統,所以咱攏共當做是自然發展兮。 04/17 15:29 是。毋管講文字是人工造作个,抑是自然發展个, 攏干焦是無仝角度來講,攏成立; 逐家莫像 saram 共「文字」vs.「人造語言」vs.「creole 混合語言」 概念完全相濫亂使講著好矣! : → saram: 誰說一開始就要上網路電腦文字頁? 04/18 17:07 If you have eyes, please check out my comment: ": → MilchFlasche: 字符太多,對Unicode制訂和字型製作都是一大挑戰哦 04/16" ": → MilchFlasche: 紙上畫畫或是用電腦繪圖還可以。有興趣就加油囉 04/16" : → saram: 台語注音字與台文字有一個共通版本嗎?孩子都沒出生,就替他 04/18 17:09 : → saram: 申請入學? 04/18 17:09 : → saram: 幾百個白話字沒造出來而被教育部選定,不會有真正台語文字典 04/18 17:11 ^^^^^^ 漢字就漢字,所有的漢字是同一個集合, 哪裡分什麼「白話用的字」、「文言用的字」了? 臺語用的「白話字」就是 POJ,就是 Pe h-ōe-jī 啦, 每次看你在那邊把專有名詞拿去亂用,真的很白目。 ROC 統治臺灣當局推薦寫臺語的叫作「推薦漢字」啦, 而且也不是都罕用字啦; 然後華語 Mandarin 自己也一堆罕用字啦不用說別人 然後全世界的資訊系統進入 Unicode 時代以後沒人在「造字」或用「外字集」。 全球網際網路時代絕對需要 Unicode,就是讓同一個碼點(code point) 不管在哪個國家的系統中,refer 到的都是同一個字符(當然字型可以有所差異), 才能避免不同內碼的資料交換時變成一堆亂碼 「造字」和「外字集」的發行,是 Unicode 還不普及的年代才要做的事: Big5 標準最早只有 5401 字,所以大量的罕用字,尤其公家機關、戶政, 遇到民眾的漢字名字有罕用字,只好自己從 Big5 標準沒有制定到的空缺中, 用程式去自己畫點陣字(一樣點點點),這就是「造字」 (以前倚天中文有相關工具箱); 但是後來臺灣中文系統的字集有擴大了,我記得是到 14000 多字, 所以「造字」的需求慢慢少了; 但還是有些罕用字,剛好進入 Windows 時代, 所以有些字型商(華康、金梅、文鼎等),有些字型會搭配「外字集」, 補足主字型檔缺的字。 但這些都不是 Unicode 標準,都是臺灣自己的 Big5 標準,甚至只是個別單位在用, 根本無法交換和流通,這個單位在這個碼位造的字,拿到別的單位的電腦可能就變別的字 Unicode 組織和標準制定以後, 世界各國的人就只要一直向 Unicode 提交新字符的描述就好了, 漢字也是,常用字制訂完,擴充字 Ext-A、B、C、D、E…… 十幾年來已經不知道到幾面了, 普世的標準制定出來,再加上字型商或是一些超級神心的機構提供支援的字型 (例如日本人做的 HanaMin A、B 花園明朝體,支援 7 萬多個漢字), 這樣同一個字在支援 Unicode 系統的電腦上打出來都是同一個字, 這樣透過網際網路交換才不會亂掉嘛! 然後有這些制定好的字元,搭配字型商的產品,當然誰要拿來寫什麼語文都可以 這不是用你的早年腦袋看到的「造字」造出來的好嗎!!! 但這幾萬個 CJK Ideographs 難道是一蹴可幾的嗎? 標準的制定、字符的審訂、字型的製作(詳下), 東亞文字的工作量硬是比其他文字系統多了 n 倍; 還有 Hangul 也是,所有的音節組合多達幾萬, 一般的韓文字母支援的甚至都是以常見的一、兩萬為主, 所以 CJKV 漢字字型、韓字字型,成本都比歐美字母字型高非常多, 這不是常識嗎? 所以我說我非常尊重設計新文字系統的人, 但是不管是走西夏文路線、韓文路線、字喃路線, 那都是多少的字元和工作量, 要普及化和資訊化的話也是要進 Unicode 這關才會上世界檯面, 又不是每個人都要像習近平一樣「內循環」、做自己單位裡少數人在用的東西嘛。 所以,用手寫來設計、分享、寫作, 我絕對欣賞, 但是當我在那邊說現實上的現代技術門檻越來越高時 (我也不是要嚇人,就是講一下現在環境又不同以往了,新的文字系統的產生, 可能會長期處於難以進入現代資訊交換的體制內,如此而已!) (其實就算是非資訊時代,不也是要花大錢請工匠鑄一大批活字?我先前講過了) 就請你 saram 不用在那邊不懂裝懂,把很複雜的事情說得一派輕鬆、 再次用錯誤的資訊誤導板友、誤導世人,謝謝! : → saram: 中文電腦怎麼來的?為什麼那麼快速? 04/18 17:12 : → saram: 因為現成就有國語字典存在,挑一萬多個常用字出來,就能 04/18 17:13 : → saram: 進入圖形顯示系統了. 04/18 17:14 真的很瞎耶。你以為早年那些零壹、倚天、宏碁的漢字那些 16×16、24×24 的點陣字, 不需要由員工一個一個字點是不是?(先不管是以前的什麼「字型擴充卡」(「漢卡」) 還是磁片式的中文作業系統哦) 你以為早年的「中文電腦」是把字典翻開、用照相網片, 就可以進入「圖形顯示系統」? ○咧你會不會太跳躍了啊,活得久但不要把故事中間都忘光光好嗎 「圖像」、「圖形」咧,你覺得解析度夠好的一個「字」的圖像, 512×512 好了 = 262,144 bit = 32,768 byte,也就是 32KB,1 個字; 1 萬字 = 32 萬 KB = 320 MB 好了,溫馨提醒,早年的 DOS 電腦常見的軟碟片,一張 5" 1/4 磁片是 1.2 MB、 一張 3.5" 磁片是 1.44 MB…… 我不夠老,我小三開始用電腦那時倚天好像是「飛碟三號」 早年的中文電腦最早就只有 16×16 點陣字, 那也是每個字 256 格一個一個去點出來的好嗎! 這個年代臺灣還很少圖形化介面作業系統, 蘋果最早的麥金塔那種奢侈品我也是大一點才知道有錢人用得到那種東西, 庶民都在用 DOS + 倚天,那叫純文字介面; 做中文遊戲的人甚至可能往往要自己點字型 進入 Windows 以後,出現 TrueType font, 那也是要字型設計師一個一個用貝茲曲線或是什麼我不懂的向量曲線, 去拉出來的耶!!! 用的人你是覺得中文電腦什麼很快速?發展很快速?處理很快速? 用的人當然覺得什麼都嘛快, 但是要把你所謂什麼一萬多個中文字典裡有的常用漢字光是弄到早年的 DOS 電腦 或其他的純文字介面電腦、後來的圖形介面作業系統, 比起用 26 個羅馬字母的歐美人,需要多少成本多少人工和血淚這難道想不到嗎??? 不用自己動手,出張嘴,最簡單,最快速啦!瞎! : → saram: 你就用手寫吧,當作電腦尚未問世,大家還在鉛字排版. 04/18 17:16 : → saram: 但至少刻字前也該把台文造出來不是嗎? 04/18 17:17 : → saram: 能寫出來,就能藉圖檔在電腦顯示了. 04/18 17:18 顯示圖檔 okay 啊,有多少字元,就做多少圖檔, 然後編號,你還要做對照表, 然後要顯示句子、文章的時候就各顯神通, HTML,就打一大堆 <img src="00001.jpg"> <img src="13048.jpg"> 啊, 你當然可以寫程式或小腳本加快輸入或產生 HTML 碼的過程, 但也要你會寫程式啊; 文書處理軟體?是要把一大堆圖檔用滑鼠一個一個拖放到軟體裡開始排版嗎? 都可以的,我絕對是尊敬的,正因為新的文字系統 進入能夠具有自己的字型、輸入法來便於輸入的階段前, 這種手寫或手繪的字符在「圖檔的時代」需要不少工程才能處理, 所以我絕對尊敬有熱情的人。 但是我就不齒自己不會動手、出一張嘴、己願他力, 還一天到晚鄙視羅馬字、攻訐現有漢字書寫的努力、 一天到晚嚷嚷什麼每種語言一定要自己造字、不造字他就看不起的 saram 啦, 不懂的一堆、信口開河,抱著錯誤的認知觀來看待語言及書寫、資訊處理、 語文的現代化、資訊化這些議題, 每次隨便說幾句,就需要人家大量說明免得誤導視聽。 不過沒關係,我以後儲存 FAQ,看是不是就複製貼上就好, 反正有人想來想去都不出那幾套,轉不出來。 -- 【愛灣語 Aiuanyu】關懷臺灣語言現在未來的轉播站 https://www.facebook.com/Aiuanyu 【Taigi123】汝个臺語小學堂 http://taigi123.ga/ 【Hakka123】摎你共下來講客 http://hakka123.ga/ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.127.130.221 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/TW-language/M.1682079372.A.F92.html
MilchFlasche: 我就說樂見紙上畫或用電腦繪圖了, 04/21 20:17
MilchFlasche: 還要硬要出來假gâu 04/21 20:17
annisat: 發現這些事我都做過XD 在編碼上手繪字元或是JS造字等等等 04/22 10:21
annisat: Unicode3.0有IDC,但是這區好像還很少平台有支援 04/22 10:21
annisat: 就算有支援,編出來的碼就跟之前不一樣了,很多自動化文 04/22 10:22
annisat: 字處理會不適用 04/22 10:22
tbrs: 我只有玩過造字軟體而已 對電腦事情一竅不通 04/22 20:22
tbrs: 用畫的倒是很簡單 隨便撇一撇就一個新字出來了 04/22 20:23
tbrs: 自製臺語字就這樣小畫家造出來玩 04/22 20:25
shyuwu: 欲用電腦鬥字母音節確實無遐簡單,我設想兮台語文字閣有 04/22 20:27
shyuwu: 一種是音節文字,親像日語假名仝款,只要共韻尾參聲調改 04/22 20:27
shyuwu: 做附加符號著好辦矣。 04/22 20:27
MilchFlasche: 樓頂咱講个較成「母音附標文字」,像泰文 04/23 20:58
MilchFlasche: 假名是音節文字 04/23 20:58
shyuwu: 我設想兮台語音節文字毋是我進前貼兮,是按算共現有漢字 04/24 13:23
shyuwu: 當做靈感,仝款是共一个子音-母音兮音節寫做一个字符,甚 04/24 13:23
shyuwu: 至共子-母-子寫做一个字符嘛無要緊。 04/24 13:23
annisat: 我自己現在在做的,我覺得在現代情境下比較有意義的 04/25 09:40
annisat: 是讓新字字型可以比較快速產生的方法,對新的Unicode應用 04/25 09:42
annisat: 應該有很大的幫助 04/25 09:42
MilchFlasche: 有在做的都加油,歡迎隨時分享 04/25 12:48
shyuwu: 18樓兮讚喔 04/25 20:33
MilchFlasche: IDC我知道,期待成果 04/27 16:10