Một trong những việc hàng đầu cần làm khi dịch game là xác định font chữ và thay đổi nó. Hầu như mọi game Nhật Bản, game Tây phương đều sử dụng bộ font không chứa ký tự có dấu tiếng Việt, nên khi dịch những game này thì cần phải thay đổi sang font có thể hiển thị tiếng Việt. Và font chữ cũng là phần mà nhiều người hiểu lầm, hiểu lẫn lộn nhất.
Có rất nhiều ý kiến hỏi, đại loại như, “tại sao tôi mở file game bằng Hex editor, đã tìm thấy phần thoại nhưng gõ tiếng Việt lại bị lỗi hiển thị trong game?”
Việc này liên quan đến sự khác biệt giữa font máy tính và font của các game console. Phần bên giải thích rõ hơn cho phần đã bàn ở mục 8. (lập table).
Font PC và font console: ngày nay, các máy tính cá nhân và game dành riêng cho loại máy này thường sử dụng font vector, trong khi phần lớn game console sử dụng loại font bitmap, tức là mỗi ký tự là một dạng hình ảnh. Và font cho PC có nhiều loại, mỗi loại có những đặc tính chức năng khác nhau chứ không đơn thuần là khác nhau về mặt thẩm mỹ. Chẳng hạn, bộ font ANSI chỉ gồm các ký tự cơ bản, một số dấu câu chứ không có đầy đủ những ký tự có dấu của tiếng Việt, hay chữ Hán, chữ Kana trong tiếng Nhật…. Còn bộ font Unicode được dùng cho các ngôn ngữ không phải là ngôn ngữ Tây phương thông thường, nên nó bao hàm đầy đủ những ký tự cần thiết của tiếng Việt, tiếng Hoa, tiếng Nhật, tiếng Thái…. Trong khi đó thì bộ font cho game console chỉ chứa những ký tự mà bản thân game dùng đến.
Tuy nhiên, ngoài việc là một tập hợp những ký tự (ở dạng vector hay bitmap) và mặt thẩm mỹ (ngoại quan) ra thì còn một yếu tố quan trọng nữa để xác định bộ font, đó là dạng thức encoding của nó. Có thể hiểu encoding của một bộ font là việc gán một giá trị nào đó cho mỗi ký tự trong font. Chẳng hạn, theo lối encoding tiêu chuẩn ASCII thì ký tự M có giá trị là $4D. Đối với những ký tự cơ bản từ A, a cho đến Z và z thì giá trị của chúng là như nhau ở mọi bộ font cho PC. Tuy nhiên, đối với những ký tự “lạ” (hiếm gặp, như ký tự có dấu tiếng Việt) thì tùy vào lối encoding mà chúng có giá trị khác nhau.
Ví dụ: ký tự “â” trong bộ font Unicode có giá trị là $1EA5. Tức là khi máy tính gặp giá trị này thì nó sẽ thể hiện “â” ra màn hình. Trong khi đó, nếu theo lối encoding Unicode-UTF8 thì ký tự “â” chiếm 3 byte, là $E1BAA5.
Tuyệt đại đa số game console sử dụng lối encoding của riêng nó, không theo chuẩn như những bộ font cho PC và cũng không có game nào giống game nào. Do đó, khi bạn gõ ký tự “M” bằng Hex editor vào game thì dữ liệu được nhập vào là $4D, nhưng giá trị này lại thể hiện một ký tự khác trong game. Đây là một trong những điều khiến việc dịch game cho console khó khăn hơn dịch game cho PC.
Bộ font cho game console là một tập hợp những hình ảnh ký tự đứng cạnh nhau và được encoding sao cho mỗi giá trị hex chỉ đến mỗi ký tự trong đó. Tức là tùy vào giá trị mà máy đọc được, nó sẽ thể hiện ra màn hình ký tự thứ bao nhiêu trong bộ font chứ không quan tâm đó là ký tự gì. Do vậy, khi dịch game console, ngoài việc sửa ngoại quan của font chữ thì còn phải nắm rõ lối encoding của nó.