sql server随机获取表记录sql语句

作者:袖梨 2022-06-29

sqlserver随机取记录方法只要用newid()即可

sqlserver已经有自带的一个newid()函数,它返回的是一个GUID,因此我们可以获取表记录时按这个newid()进行排序,因为newid()的结果是每次都不一样的,所以这样子查询的结果保证了每次排序的结果均是不一样的,以下以Northwind库中的orders表为例写一下获取10条随机记录:

语法

 代码如下 复制代码

select TOP N * From TABLE Order By NewID()

SELECT TOP 10 * FROM Northwind.Orders ORDER BY NEWID()

NewID()函数将创建一个 uniqueidentifier 类型的唯一值。

执行了几次感觉上符合要求,每次出来的都不一样。至于值域分布没深究,随机函数本身也是伪随机的。
做了个简单的测试

 代码如下 复制代码

CREATE TABLE #t(cname char(50) ,sysid uniqueidentifier)

DECLARE @i int

set @i = 0

WHILE (@i) < 1760
BEGIN
    INSERT INTO #t select top 1 cname,sysid from tVIPMember  order by newid()
    SET  @i = @i + 1
END

select count(*) from
 (select cname as a from #t group by cname,sysid ) a

库里一共是1760条记录,执行了几次结果在 1100 -1200 左右。

但是上面方法如果过万记录你会发现很慢哦,我们再接着来优化newid()

 代码如下 复制代码
CREATE DEFINER=`root`@`%` PROCEDURE `rand_data`(IN `tbName` VARCHAR(50), IN `rowCnt` INT, IN `tbKey` VARCHAR(50))
    LANGUAGE SQL
    NOT DETERMINISTIC
    CONTAINS SQL
    SQL SECURITY DEFINER
    COMMENT '随机获取若干记录,只适用于单主键表'
BEGIN
 
    #获取主键名
    IF tbKey IS NOT NULL THEN
        SET @tbKey=tbKey;#参数里面已经有,这种情况比较快
    ELSE
        #参数里面没,从系统表查找主键,比较耗时
        SELECT @tbKey:=c.COLUMN_NAME
        FROM
            INFORMATION_SCHEMA.TABLE_CONSTRAINTS AS t,
            INFORMATION_SCHEMA.KEY_COLUMN_USAGE AS c
        WHERE
            t.TABLE_NAME = c.TABLE_NAME
            AND t.TABLE_SCHEMA = c.TABLE_SCHEMA
            AND t.TABLE_SCHEMA = database()
            AND t.TABLE_NAME = tbName
            AND t.CONSTRAINT_TYPE = 'PRIMARY KEY';
    END IF;
         
    #获取最大id,最小id和记录数
    SET @getMaxIdSql = CONCAT('SELECT @maxId:=MAX(', @tbKey, '),',
        '@minId:=MIN(', @tbKey, '),',
        '@totalCnt:=COUNT(', @tbKey, ')',
        ' FROM `', tbName, '`;');
    PREPARE getMaxId FROM @getMaxIdSql;
    EXECUTE getMaxId;
    DEALLOCATE PREPARE getMaxId;
     
    #创建临时表
    DROP TABLE IF EXISTS rand_tt;
    SET @temTbSql = CONCAT('CREATE TEMPORARY TABLE rand_tt SELECT 0 aid,tb.* FROM `',tbName,'` tb LIMIT 0;');
    PREPARE temTb FROM @temTbSql;
    EXECUTE temTb;
    DEALLOCATE PREPARE temTb;
     
    #构建获取一条记录的sql
    SET @randRowSql = CONCAT('INSERT INTO rand_tt SELECT @cnt:=@cnt+1 aid,tb.* FROM ',
        tbName, ' tb WHERE tb.', @tbKey, '=?;');
    PREPARE addRow FROM @randRowSql;
     
    #生成随机记录
    SET @cnt=0;
    insertLoop: LOOP
        SET @id=FLOOR(RAND()*(@maxId-@minId)+@minId);
        IF NOT EXISTS (SELECT id FROM rand_tt WHERE id=@id) THEN
            EXECUTE addRow USING @id;
            IF @cnt >= rowCnt OR @cnt >= @totalCnt THEN
                LEAVE insertLoop;
            END IF;
        END IF;
    END LOOP insertLoop;    
    DEALLOCATE PREPARE addRow;
     
    #返回数据
    ALTER TABLE rand_tt DROP COLUMN aid;
    SELECT * FROM rand_tt;

END这样我再执行你会发现100W数据只要0.几步即可解决哦。

相关文章

精彩推荐