본문 바로가기

보안정보

UTF-8 과 EUC-KR는 무엇인가?

UTF-8은 유니코드입니다.

유니코드는 전세계의 모든 문자를 한꺼번에 표현할 수 있는 인코딩입니다.

한글도 완벽히 표현할 수 있습니다.

유니코드에도 여러가지 종류가 있는데, 인터넷에 올릴 HTML 파일을 유니코드로 작성할때는 반드시 UTF-8이여야 합니다.

 

EUC-KR은 한글과 '한국에서 통용되는 한자' 그리고 '영문'을 표현할 수 있습니다.

그러나 일본식 한자/중국어의 간체자 등은 표현 할 수 없습니다.

또한 프랑스어의 악상이나 독일어의 움라우트 등도 표현할 수 없습니다.

다만 HTML문서의 경우 EUC-KR로도, 외국 문자를 정확히 표현하는 방법이 있습니다.

 

요즘의 외국사이트들은 대체로 UTF-8을 사용합니다.

따라서 미래 지향적인 사이트를 만들려면 UTF-8이 좋습니다.

다만 UTF-8로 HTML문서를 만들면 파일의 용량이 다소 늘어나는 문제가 있습니다.

EUC-KR에서는 한글 1자가 2바트이지만 UTF-8에서는 한글 1글자가 3바이트 입니다.

다만 영문이나 숫자나 공백이나 특수 기호 등은 1바이트입니다.

 

Unicode(유니코드)란 ?

세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약의 이름이다.

8비트 문자코드인 아스키코느를 16비트로 확장하여 전세계의 모든 문자를 표현하는 표준코드이다.

8비트로 표현할 수 있는 256자는 영어나 라틴권 등에서 문제가 없으나, 한국,일본,중국,아랍 등의 다양한 문자들을 표현하는데 한계가 있다.

또한 각 나라마다 같은 코드 값에 다른 글자를 쓰는 방식으로는 국제간의 원활한 자료교환이 불가능하기 때문에 코드를 16비트 체제로 확장해서 65,536자의 영역 안에 전 세계의 모든 글자를 표시하는 표준안이다.

영어를 사용하는 국가에서 아스키 코드보다 두배의 공간이 필요하기 때문에 일반적이 통신등에서는 그 만큼의 낭비가 되지만 유니코드를 이용하면 프로그램을 하나만 만들면 모든 나라들의  글자를 처리할 수 있기 때문에 그 만큼 큰 이점도 된다.

출처 : http://blog.naver.com/junhwen?Redirect=Log&logNo=130080223604 

[출처] utf-8 / euc-kr 의 차이 |작성자 굿맨

'보안정보' 카테고리의 다른 글

[맥] 터미널 root 초기 패스워드 설정  (0) 2014.09.30
보안관련 자격증  (0) 2010.11.02
COOXIE 해킹툴.  (2) 2010.09.09
워게임 주소들...  (0) 2010.09.09
HTTP 응답 코드 번호  (3) 2010.08.30