MySQL Full-Text Search 7 MySQL

7. 풀텍스트 인덱싱을 위한 데이터 정렬 추가

이 섹션에서는 전체 텍스트 검색을 위해 새로운 데이터 정렬을 추가하는 방법을 설명합니다. 샘플 데이터 정렬은 latin1_swedish_ci와 비슷하지만 구두점 문자가 아닌 문자로 '-'문자를 처리하므로 단어 문자로 색인 할 수 있습니다. 데이터 정렬 추가에 대한 일반적인 정보는 10.13 절. "문자 집합에 데이터 정렬 추가"에 있습니다. 당신이 그것을 읽고 관련 파일에 익숙하다고 가정합니다.

전체 텍스트 인덱싱에 대한 데이터 정렬을 추가하려면 다음 절차를 사용하십시오. 이 단원에서는 10.13 절. "문자 집합에 데이터 정렬 추가"에서 설명했듯이 문자 집합 속성을 설명하는 구성 파일을 사용하여 간단한 문자 집합에 대한 데이터 정렬을 추가 할 수 있습니다. 유니 코드와 같은 복잡한 문자 집합의 경우 문자 집합 속성을 설명하는 C 소스 파일을 사용하여 데이터 정렬을 만듭니다.

1. Index.xml 파일에 데이터 정렬을 추가합니다. 대조 ID는 사용하지 않아야하므로 해당 ID가 시스템에서 이미 사용 된 경우 62와 다른 값을 선택하십시오.

  1. <charset name="latin1">...<collation name="latin1_fulltext_ci" id="62"/></charset>
2. latin1.xml 파일에서 데이터 정렬의 정렬 순서를 선언하십시오. 이 경우 latin1_swedish_ci에서 주문을 복사 할 수 있습니다.
<collation name="latin1_fulltext_ci"><map>00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F10 11 12 13 14 15 16 17 18 19 1A 1B 1C 1D 1E 1F20 21 22 23 24 25 26 27 28 29 2A 2B 2C 2D 2E 2F30 31 32 33 34 35 36 37 38 39 3A 3B 3C 3D 3E 3F40 41 42 43 44 45 46 47 48 49 4A 4B 4C 4D 4E 4F50 51 52 53 54 55 56 57 58 59 5A 5B 5C 5D 5E 5F60 41 42 43 44 45 46 47 48 49 4A 4B 4C 4D 4E 4F50 51 52 53 54 55 56 57 58 59 5A 7B 7C 7D 7E 7F80 81 82 83 84 85 86 87 88 89 8A 8B 8C 8D 8E 8F90 91 92 93 94 95 96 97 98 99 9A 9B 9C 9D 9E 9FA0 A1 A2 A3 A4 A5 A6 A7 A8 A9 AA AB AC AD AE AFB0 B1 B2 B3 B4 B5 B6 B7 B8 B9 BA BB BC BD BE BF41 41 41 41 5C 5B 5C 43 45 45 45 45 49 49 49 4944 4E 4F 4F 4F 4F 5D D7 D8 55 55 55 59 59 DE DF41 41 41 41 5C 5B 5C 43 45 45 45 45 49 49 49 4944 4E 4F 4F 4F 4F 5D F7 D8 55 55 55 59 59 DE FF</map></collation>

latin1.xml에서 ctype 배열을 수정하십시오. 0x2D ( '-'문자의 코드)에 해당하는 값을 10 (문장 부호)에서 01 (대문자)으로 변경하십시오. 다음 배열에서 이것은 네 번째 행 아래 요소이며 끝에서 세 번째 값입니다.

  1. <ctype><map>0020 20 20 20 20 20 20 20 20 28 28 28 28 28 20 2020 20 20 20 20 20 20 20 20 20 20 20 20 20 20 2048 10 10 10 10 10 10 10 10 10 10 10 10 01 10 1084 84 84 84 84 84 84 84 84 84 10 10 10 10 10 1010 81 81 81 81 81 81 01 01 01 01 01 01 01 01 0101 01 01 01 01 01 01 01 01 01 01 10 10 10 10 1010 82 82 82 82 82 82 02 02 02 02 02 02 02 02 0202 02 02 02 02 02 02 02 02 02 02 10 10 10 10 2010 00 10 02 10 10 10 10 10 10 01 10 01 00 01 0000 10 10 10 10 10 10 10 10 10 02 10 02 00 02 0148 10 10 10 10 10 10 10 10 10 10 10 10 10 10 1010 10 10 10 10 10 10 10 10 10 10 10 10 10 10 1001 01 01 01 01 01 01 01 01 01 01 01 01 01 01 0101 01 01 01 01 01 01 10 01 01 01 01 01 01 01 0202 02 02 02 02 02 02 02 02 02 02 02 02 02 02 0202 02 02 02 02 02 02 10 02 02 02 02 02 02 02 02</map></ctype>

4. 서버를 다시 시작하십시오.

5. 새 데이터 정렬을 사용하려면 데이터 정렬을 사용할 열 정의에 포함시킵니다.

mysql> DROP TABLE IF EXISTS t1;Query OK, 0 rows affected (0.13 sec)mysql> CREATE TABLE t1 ( -> a TEXT CHARACTER SET latin1 COLLATE latin1_fulltext_ci, -> FULLTEXT INDEX(a) -> ) ENGINE=MyISAM;Query OK, 0 rows affected (0.47 sec)


하이픈이 단어 문자로 간주되는지 확인하려면 데이터 정렬을 테스트하십시오.

mysql> INSERT INTO t1 VALUEs ('----'),('....'),('abcd');Query OK, 3 rows affected (0.22 sec)Records: 3 Duplicates: 0 Warnings: 0mysql> SELECT * FROM t1 WHERE MATCH a AGAINST ('----' IN BOOLEAN MODE);+------+| a |+------+| ---- |+------+1 row in set (0.00 sec)


덧글

댓글 입력 영역