글꼴에 사용되는 문자 집합
모든 글꼴은 문자 집합을 사용합니다. 문자 집합에는 문장 부호, 숫자, 대문자 및 소문자 및 기타 모든 인쇄 가능한 문자가 포함됩니다. 문자 집합의 각 요소는 숫자로 식별됩니다.
사용 중인 대부분의 문자 집합은 32에서 127까지의 96개 숫자 값에 대한 문자를 정의하는 미국 ASCII 문자 집합의 상위 집합입니다. 문자 집합에는 5개의 주요 그룹이 있습니다.
- Windows
- Unicode
- OEM(원래 장비 제조업체)
- 기호
- 공급업체별
Windows 문자 집합
Windows 문자 집합은 가장 일반적으로 사용되는 문자 집합입니다. 기본적으로 ANSI 문자 집합과 동일합니다. 빈 문자는 Windows 문자 집합의 첫 번째 문자입니다. 16진수 값은 0x20(10진수 32)입니다. Windows 문자 집합의 마지막 문자의 16진수 값은 0xFF(10진수 255)입니다.
대부분의 글꼴은 기본 문자를 지정합니다. 글꼴에 없는 문자에 대한 요청이 있을 때마다 시스템은 이 기본 문자를 제공합니다. Windows 문자 집합을 사용하는 많은 글꼴은 마침표(.)를 기본 문자로 지정합니다. TrueType 및 OpenType 글꼴은 일반적으로 열린 상자를 기본 문자로 사용합니다.
글꼴은 쿼드라는 나누기 문자를 사용하여 단어를 구분하고 텍스트를 정당화합니다. Windows 문자 집합을 사용하는 대부분의 글꼴은 빈 문자가 중단 문자로 사용되도록 지정합니다.
유니코드 문자 집합
Windows 문자 집합은 8비트 를 사용하여 각 문자를 나타냅니다. 따라서 8비트로 표현할 수 있는 최대 문자 수는 256자(2^8)입니다. 이는 일반적으로 프랑스어, 독일어, 스페인어 및 기타 언어로 사용되는 광신도 표시를 포함하여 서양 언어에 충분합니다. 그러나 동부 언어는 싱글 바이트 코딩 체계를 사용하여 인코딩할 수 없는 수천 개의 개별 문자를 사용합니다. 컴퓨터 상거래가 확산하면서 8비트, 16비트, 24비트 또는 32비트 시퀀스로 문자를 나타낼 수 있도록 더블 바이트 코딩 체계가 개발되었습니다. 이렇게 하려면 복잡한 전달 알고리즘이 필요합니다. 그럼에도 불구하고 다른 코드 집합을 사용하면 두 컴퓨터에서 완전히 다른 결과를 얻을 수 있습니다.
여러 코딩 체계의 문제를 해결하기 위해 데이터 표현을 위한 유니코드 표준이 개발되었습니다. 16비트 문자 코딩 체계인 유니코드는 65,536자(2^16)를 나타낼 수 있으며, 이는 오늘날 컴퓨터 상거래의 모든 언어와 문장 부호, 수학 기호 및 확장 공간을 포함하기에 충분합니다. 유니코드는 모든 문자에 대해 고유한 코드를 설정하여 문자 번역이 항상 정확한지 확인합니다.
OEM 문자 집합
OEM 문자 집합은 일반적으로 화면 표시를 위해 전체 화면 MS-DOS 세션에서 사용됩니다. 32~127자의 문자는 일반적으로 OEM, 미국 ASCII 및 Windows 문자 집합에서 동일합니다. OEM 문자 집합의 다른 문자(0~31 및 128~255)는 전체 화면 MS-DOS 세션에 표시할 수 있는 문자에 해당합니다. 이러한 문자는 일반적으로 Windows 문자와 다릅니다.
기호 문자 집합
기호 문자 집합에는 일반적으로 수학 및 과학적 수식을 나타내는 데 사용되는 특수 문자가 포함되어 있습니다.
공급업체별 문자 집합
많은 프린터 및 기타 출력 디바이스는 Windows 및 OEM 집합과 다른 문자 집합을 기반으로 글꼴을 제공합니다. 예를 들어 EBCDIC(Extended Binary Coded Decimal Interchange Code) 문자 집합입니다. 이러한 문자 집합 중 하나를 사용하려면 프린터 드라이버가 Windows 문자 집합에서 공급업체별 문자 집합으로 변환됩니다.