MySQL 有許多傳回字串的運算子和函式。本節解答以下問題:此類字串的字元集和校對是什麼?
對於接受字串輸入並傳回字串結果作為輸出的簡單函式,輸出的字元集和校對與主要輸入值相同。例如,UPPER(
傳回與 X
)X
具有相同字元字串和校對的字串。相同的規則適用於 INSTR()
、LCASE()
、LOWER()
、LTRIM()
、MID()
、REPEAT()
、REPLACE()
、REVERSE()
、RIGHT()
、RPAD()
、RTRIM()
、SOUNDEX()
、SUBSTRING()
、TRIM()
、UCASE()
和 UPPER()
。
與所有其他函式不同,REPLACE()
函式總是忽略字串輸入的校對,並執行區分大小寫的比較。
如果字串輸入或函式結果為二進位字串,則該字串具有 binary
字元集和校對。可以使用 CHARSET()
和 COLLATION()
函式檢查這一點,這兩個函式都會為二進位字串引數傳回 binary
mysql> SELECT CHARSET(BINARY 'a'), COLLATION(BINARY 'a');
+---------------------+-----------------------+
| CHARSET(BINARY 'a') | COLLATION(BINARY 'a') |
+---------------------+-----------------------+
| binary | binary |
+---------------------+-----------------------+
對於合併多個字串輸入並傳回單個字串輸出的操作,標準 SQL 的「彙總規則」適用於決定結果的校對
如果出現明確的
COLLATE
,則使用Y
Y
。如果出現明確的
COLLATE
和Y
COLLATE
,則引發錯誤。Z
否則,如果所有校對都是
Y
,則使用Y
。否則,結果沒有校對。
例如,使用 CASE ... WHEN a THEN b WHEN b THEN c COLLATE
,產生的校對為 X
ENDX
。相同的規則適用於 UNION
、||
、CONCAT()
、ELT()
、GREATEST()
、IF()
和 LEAST()
。
對於轉換為字元資料的操作,操作產生的字串的字元集和定序由 character_set_connection
和 collation_connection
系統變數定義,這些變數決定預設的連線字元集和定序(請參閱第 12.4 節「連線字元集和定序」)。這僅適用於 BIN_TO_UUID()
、 CAST()
、 CONV()
、 FORMAT()
、 HEX()
和 SPACE()
。
虛擬產生欄位的表示式是上述原則的例外。在這些表示式中,無論連線字元集為何,表格字元集都用於 BIN_TO_UUID()
、CONV()
或 HEX()
的結果。
如果對於字串函數傳回結果的字元集或定序有任何疑問,請使用 CHARSET()
或 COLLATION()
函數來查詢。
mysql> SELECT USER(), CHARSET(USER()), COLLATION(USER());
+----------------+-----------------+--------------------+
| USER() | CHARSET(USER()) | COLLATION(USER()) |
+----------------+-----------------+--------------------+
| test@localhost | utf8mb3 | utf8mb3_general_ci |
+----------------+-----------------+--------------------+
mysql> SELECT CHARSET(COMPRESS('abc')), COLLATION(COMPRESS('abc'));
+--------------------------+----------------------------+
| CHARSET(COMPRESS('abc')) | COLLATION(COMPRESS('abc')) |
+--------------------------+----------------------------+
| binary | binary |
+--------------------------+----------------------------+