从生产导出数据到测试,出现如下错误
ORA-02374: conversion error loading table "SWTONLINE"."TBL_TRANS_LOG_HISTORY_B"
ORA-12899: value too large for column MER_ADDR_NAME (actual: 54, maximum: 40)
初步估计为字符集差异导致.中文在UTF-8里占3个字节,ZHS16GBK里占2个字节
查看测试库字符集
代码如下 | 复制代码 |
sys@PROD>select * from V$NLS_PARAMETERS PARAMETER VALUE 19 rows selected. Elapsed: 00:00:00.00 |
查看生产库字符集
代码如下 | 复制代码 |
sys@ORADB>select * from V$NLS_PARAMETERS; PARAMETER VALUE 19 rows selected. Elapsed: 00:00:00.00 |
更改测试库的字符集和生产库一样
代码如下 | 复制代码 |
sys@PROD>SHUTDOWN IMMEDIATE; Total System Global Area 939495424 bytes System altered. Elapsed: 00:00:02.19 System altered. Elapsed: 00:00:00.02 System altered. Elapsed: 00:00:00.01 Database altered. Elapsed: 00:00:05.09
|
---报字符集不兼容,此时用INTERNAL_USE指令不对字符集超集进行检查
代码如下 | 复制代码 |
sys@PROD>ALTER DATABASE CHARACTER SET INTERNAL_USE ZHS16GBK;
Elapsed: 00:00:53.35 |
重新启动数据库,再次导入,即可成功.
代码如下 | 复制代码 |
[oracle@idata ~]$ impdp '/ as sysdba ' directory=backup dumpfile=cil_20130702.dmp logfile=cil_20130703.log table_exists_action=replace schemas=EPAYMENT,LOGSDB,PREPAID,RISK,SWTSETTLE,SWTONLINE |
补充一下oracle字符编码问题
通常会查询NLS_CHARACTERSET(数据库字符集),NLS_NCHAR_CHARACTERSET(国家字符集),应该要存储多种语言,需要字符集为UTF-8。
代码如下 | 复制代码 |
SELECT * FROM V$NLS_PARAMETERS WHERE PARAMETER IN ('NLS_CHARACTERSET', 'NLS_NCHAR_CHARACTERSET'); |
结果UTF-8,OK。
查看没问题的DB里 FieldA varchar2(10 char)
查看有问题的DB里 FieldA varchar2(10)
(没出现问题之前还真没注意到这两种定义是有区别的。。。)
UTF-8里一个中文字符是3 bytes,从上面的定义可以看出来,如果char/byte 定义导致的可存储数据长度相差很大了。
设置参数NLS_LENGTH_SEMANTICS可以在create table时对CHAR 或者VARCHAR2列指定使用字节(byte)或者字符(character)来定义长度。
NCHAR, NVARCHAR2, CLOB, and NCLOB 列都是基于字符(character)的。
NLS_LENGTH_SEMANTICS不会影响到SYS和SYSTEM用户表,数据字典定义都使用字节(byte)。
可以在定义列时候显示指定使用字节(byte)或者字符(character)来定义长度:
CHAR(10 BYTE) - 无论NLS_LENGTH_SEMANTICS设置成什么,都使用字节(byte)。
CHAR(10 CHAR) - 无论NLS_LENGTH_SEMANTICS设置成什么,都使用字符(char)。