: → erspicu: 對ss比較好奇的點是這種架構特殊性下,如果不用直譯,用 06/22 08:03
: → erspicu: 上一些jit加速做法效能能獲得多少改善以及會不會導致無法 06/22 08:03
: → erspicu: 保持正確timing。 06/22 08:03
我為了保持 accuracy 而採用 LLE 途徑,所以採用直譯執行是難免的。
既然這樣,JIT compilation 幾乎做不到,或是我才疏學淺,不知道如何妥善實作,
總之計較到 cycle 的粒度下,我認為是沒有餘裕可以做 JIT compilation 的;
不過調整編譯器的 LTO,還有使用 PGO,多多少少還是能夠搾出一點效能。
另外我把表現層(俗稱前端)與模擬器層分開,用不同的 CPU core 分攤負荷,
也是偷到了一點點效能。
大概是這樣。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.59.84 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Emulator/M.1782701984.A.AC5.html