언어/기타

[C++] 한글과 영어가 섞인 문자열의 길이 체크

by Zeprod posted Jun 01, 2007
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

 


이번에는 꼭 게임을 만들때 필요한건 아니지만, 한국에서 프로그램을 만들려면 알아두면 좋은 팁을 소개합니다.


 


컴퓨터라는 기계가 처음은 영어권 나라에서 발명이 된 고로, 문자열 체계도 영문법만을 공식 지원합니다.


 


그래서 만들어둔 팁을 공개하도록 하겠습니다.


 


 


- 여기부터 -


 


 


 


일반적으로 char 배열에 문자열을 넣고 저장을 하는데, 이때 그냥 strlen 함수로 검사를 하면, 한글은 2글자로 인식해서 길이를 내주게 되죠.


'안녕하세요! 123'의 경우, 실제 문자열의 길이는 10이지만, strlen의 결과는 15가 나온다는 것...


WideByte 형 문자열 (WCHAR 라던지..)에서는 모든 글자를 1배열에 저장을 할 수 있어, 약간의 착오가 생길 수 있습니다.



이 때문에 WideByte 형 문자열로 변환할 때 한글이 섞이면 길이 체크 실수로 이것저것 문제가 생길 수가 있습니다..


여기서 중요한 포인트는 다음과 같습니다.



[한글의 시작비트은 1로 시작합니다.] => [즉, 한글인지 체크하려면 0x80과 &연산을 취해보면 된다고 합니다. ' ';]



그래서 길이체크 함수를 직접 만들어보면...


size_t strlen_kr(char* str)
{
       size_t size = 0;
       size_t i = 0;
       for (;;i++)
       {
              if (str[i] & 0x80)     // 한글이다! 배열 인식의 키인 i를 1번더 증가시키자!
              {
                      size++;
                      i++;
              }
              else if (str[i] == 0)  // 문자열의 끝이다! '' 이다! 종료~
                      break;
              else                     // 아니면 일반 아스키로 간주하고 사이즈 1 증가!
                      size++;
       }
       return size;
}



다음과 같이 됩니다. 실행속도는 문자열 길이에 비례합니다. ' 'a


심각한 문제는 아니었지만, 그냥 문자변환시 깔끔하게 처리할 수 있게 되었네요..


 


 


Articles

3 4 5 6 7 8 9 10 11 12