LOCATE()返回子串首次出现的起始位置(从1开始计数),未找到返回0;参数顺序为LOCATE(子串, 字符串[, 起始位置]),支持第三个参数指定搜索起点,大小写敏感性由collation决定。
LOCATE() 找字符位置MySQL 没有 INSTR() 的标准 SQL 版本,但 LOCATE() 是最直接的选择。它返回子串首次出现的起始位置(从 1 开始计数),没找到则返回 0。
注意:第二个参数是被搜索的字符串,第一个参数才是要找的字符或子串 —— 这和很多语言的函数顺序相反,容易写反。
LOCATE('a', 'banana') → 返回 2(不是 1)LOCATE('x', 'hello') → 返回 0,不是 NULL,判断时别用 IS NULL
LOCATE('a', 'banana', 3) → 返回 4
POSITION() 或 STRPOS()
PostgreSQL 提供两个等效函数:POSITION() 符合 SQL 标准,STRPOS() 是 PostgreSQL 自带的别名,行为一致,都返回从 1 开始的位置,未找到返回 0。
POSITION('o' IN 'hello') → 返回 5;注意语法是 POSITION(sub IN str),中间用 IN 关键字STRPOS('hello', 'l') → 返回 3;参数顺序和 MySQL 的 LOCATE() 一样SUBSTRING() 截取再查CHARINDEX()
CHARINDEX() 是 SQL Server 的标准方案,返回从 1 开始的位置,找不到返回 0。它支持可选的第三个参数表示起始搜索位置。
CHARINDEX('e', 'hello') → 返回 2
CHARINDEX('l', 'hello', 3) → 返回 4(从第 3 位开始找,跳过了第一个 l)COLLATE SQL_Latin1_General_CP1_CI_AS
所有主流数据库都用“从 1 开始”而非“从 0 开始”,这点和编程语言习惯不同,直接参与计算(比如切片)前务必减 1;另外,返回值为 0 表示未找到,不是错误,所以 WHERE CHARINDEX(...) > 0 才是正确过滤写法。
LOCATE() 和 FIND_IN_SET() 混用:FIND_IN_SET() 只适用于逗号分隔的字符串列表,且只匹配完整项REGEXP_SUBSTR() 配合变量模拟,但性能差;更现实的做法是导出后用程序处理ORDER BY 或 GROUP BY 中使用这些函数时,注意它们不可索引,可能触发全表扫描SELECT 试一两条数据,看返回值是不是你预期的“从 1 开始”的整数 —— 很多人卡在以为返回的是 0 起始,结果切串偏了。