我刚刚买了一本书“C接口和实现”.
在第一章中,它实现了一个“Atom”结构,示例代码如下:
#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0])))
static struct atom {
    struct atom *link;
    int len;
    char *str;
} *buckets[2048];
static unsigned long scatter[] = {
2078917053,143302914,1027100827,1953210302,755253631,2002600785,1405390230,45248011,1099951567,433832350,2018585307,438263339,813528929,1703199216,618906479,573714703,766270699,275680090,1510320440,1583583926,1723401032,1965443329,1098183682,1636505764,980071615,1011597961,643279273,1315461275,157584038,1069844923,471560540,89017443,1213147837,1498661368,2042227746,1968401469,1353778505,1300134328,2013649480,306246424,1733966678,1884751139,744509763,400011959,1440466707,1363416242,973726663,59253759,1639096332,336563455,1642837685,1215013716,154523136,593537720,704035832,1134594751,1605135681,1347315106,302572379,1762719719,269676381,774132919,1851737163,1482824219,125310639,1746481261,1303742040,1479089144,899131941,1169907872,1785335569,485614972,907175364,382361684,885626931,200158423,1745777927,1859353594,259412182,1237390611,48433401,1902249868,304920680,202956538,348303940,1008956512,1337551289,1953439621,208787970,1640123668,1568675693,478464352,266772940,1272929208,1961288571,392083579,871926821,1117546963,1871172724,1771058762,139971187,1509024645,109190086,1047146551,1891386329,994817018,1247304975,1489680608,706686964,1506717157,579587572,755120366,1261483377,884508252,958076904,1609787317,1893464764,148144545,1415743291,2102252735,1788268214,836935336,433233439,2055041154,2109864544,247038362,299641085,834307717,1364585325,23330161,457882831,1504556512,1532354806,567072918,404219416,1276257488,1561889936,1651524391,618454448,121093252,1010757900,1198042020,876213618,124757630,2082550272,1834290522,1734544947,1828531389,1982435068,1002804590,1783300476,1623219634,1839739926,69050267,1530777140,1802120822,316088629,1830418225,488944891,1680673954,1853748387,946827723,1037746818,1238619545,1513900641,1441966234,367393385,928306929,946006977,985847834,1049400181,1956764878,36406206,1925613800,2081522508,2118956479,1612420674,1668583807,1800004220,1447372094,523904750,1435821048,923108080,216161028,1504871315,306401572,2018281851,1820959944,2136819798,359743094,1354150250,1843084537,1306570817,244413420,934220434,672987810,1686379655,1301613820,1601294739,484902984,139978006,503211273,294184214,176384212,281341425,228223074,147857043,1893762099,1896806882,1947861263,1193650546,273227984,1236198663,2116758626,489389012,593586330,275676551,360187215,267062626,265012701,719930310,1621212876,2108097238,2026501127,1865626297,894834024,552005290,1404522304,48964196,5816381,1889425288,188942202,509027654,36125855,365326415,790369079,264348929,513183458,536647531,13672163,313561074,1730298077,286900147,1549759737,1699573055,776289160,2143346068,1975249606,1136476375,262925046,92778659,1856406685,1884137923,53392249,1735424165,1602280572
};
const char *Atom_new(const char *str,int len) {
    unsigned long h;
    int i;
    struct atom *p;
    assert(str);
    assert(len >= 0);
    for (h = 0,i = 0; i < len; i++)
        h = (h<<1) + scatter[(unsigned char)str[i]];
    h &= NELEMS(buckets)-1;
    for (p = buckets[h]; p; p = p->link)
        if (len == p->len) {
            for (i = 0; i < len && p->str[i] == str[i]; )
                i++;
            if (i == len)
                return p->str;
        }
    p = ALLOC(sizeof (*p) + len + 1);
    p->len = len;
    p->str = (char *)(p + 1);
    if (len > 0)
        memcpy(p->str,str,len);
    p->str[len] = '\0';
    p->link = buckets[h];
    buckets[h] = p;//insert atom in front of list
    return p->str;
}

在本章末尾,在练习3.1中,该书的作者说
“大多数文本都建议使用素数作为
桶.使用素数和良好的散列函数通常会给出一个
更好地分配挂在水桶上的列表的长度.
Atom使用2的幂,有时明确引用
作为一个糟糕的选择.编写一个程序来生成或读取10,000个
典型的字符串和度量Atom_new的速度和分布
列表的长度.然后更换桶以使其具有
2,039个条目(最大素数小于2,048),并重复
测量.使用黄金帮助吗?你有多少
结论取决于你的具体机器?“

所以我确实将哈希表的大小更改为2039,但它似乎是实际制作的素数
列表长度分布不好,我试过64,61,61实际上也做了不好的分配.

我只是想知道为什么一个素数表大小做出错误的分布,这是因为与Atom_new一起使用的哈希函数是一个糟糕的哈希函数吗?

我正在使用此函数打印出原子列表的长度

#define B_SIZE 2048
void Atom_print(void)
{
    int i,t;
    struct atom *atom;
    for(i= 0;i<B_SIZE;i++) {
        t = 0;
        for(atom=buckets[i];atom;atom=atom->link) {
            ++t;
        }
        printf("%d ",t);
    }
}

解决方法

好吧,前段时间我不得不实现哈希表(在驱动程序开发中),我差不多.为什么我应该使用素数? OTOH功率为2甚至更好 – 而不是在功率为2的情况下计算模数,您可以使用按位AND.

所以我实现了这样一个哈希表.键是一个指针(由一些第三方函数返回).然后,最终我注意到在我的哈希表中只有1/4的条目被填充.因为我使用的哈希函数是身份函数,以防万一它所有返回的指针都是4的倍数.

使用素数作为哈希表大小的想法如下:实际哈希函数不产生均匀分布的值.通常存在(或至少可能存在)一些依赖性.因此,为了扩散此分布,建议使用素数.

顺便说一句,理论上可能会发生哈希函数偶尔产生的数字是你选择的素数的倍数.但这种可能性低于它不是素数的概率.

c – 哈希表实现的更多相关文章

  1. ios – 如何使用Objective C类中的多个参数调用Swift函数?

    本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

  2. ios – Swift:递归值类型

    我有一个结构,我想要一个结构类型的全局变量?这个例子本质上是我实际创建的结构的简化版本.但是,它会抛出错误:有没有办法解决这个问题?

  3. Swift疑点解决2

    关于Swift中的String类型,String是一个结构体类型包含字符串的unicode但是长度没法算,同样没有length方法。因为Nsstring是OC中的类型,但是苹果工程师做了很好的兼容。还有Swift里一下非常好的方法如varops3=ops.map{$0.description}

  4. 玩转swift字符串——Advanced

    最近在尝试学一些iOSswift开发,要做一个“四则运算计算器”,其中涉及到很多字符串运算,终于在不断查阅文档和stackoverflow的情况下完成。inreverse){printlneachChar}字符串拼接//拼接字符串型str+="Hello"//拼接非字符串型varchCharacter="!"))字符串分割varstr6"welcometoplayswift"//以空格作为分割依据str6.componentsSeparatedByString"")varstr7"welcometopla

  5. 《Swift NSDictionary 的详细使用和部分方法介绍 和 哈希表散列)的阐述和解释 》

    /*《SwiftNSDictionary的详细使用和部分方法介绍和哈希表(散列)的阐述和解释》*//*第一步:我们首先,必须了解一个概念性的东西那就是:哈希哈希的主要解释是:哈希算法将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。2》哈希列表是跟进式变化的。作为线性数据结构与表格和队列等相比,哈希表无疑是查找速度比较快的一种。在哈希方法中使用的转换函数hash被称作哈希函数。按照此中算法构造出来的表叫做哈希表。

  6. Swift利用闭包反向传值

    写个Demo来用闭包实现下控制器反向传值界面十分简单,点击按钮进入第二个控制器,在textfield中输入文字后返回,主页面的label文字便自动更改。首先按照开发逻辑实现第二个控制器的闭包函数:定义个闭包类型,需要传递的参数为String而且注意返回值是Void然后就是声明一个方法用来保存传入的闭包,并且在将要退出控制器的时候传出textfield的文字:回到第一个控制器,在prepareForSegue方法中获得第二个控制器然后执行刚写的方法:大功告成~~

  7. Swift快速入门二基本数据类型

    相关文章Swift快速入门(一)第一个Swift程序1.变量和常量声明常量和变量Swfit是强类型的语言,Swift要求所有的变量和常量必须先声明后使用。就像Swift的其他类型一样,整数类型采用大写命名法。此外Swift还支持对无符号整数的支持。整数数值表现形式Swift整数数值有4种表示方式:十进制:默认的就是十进制整数。Swift提供了两种有符号浮点数类型:Double表示64位浮点数。

  8. swift 02 基本数据类型

    就像Swift的其他类型一样,整数类型采用大写命名法。此外Swift还支持对无符号整数的支持。整数数值表现形式Swift整数数值有4种表示方式:十进制:默认的就是十进制整数。Swift提供了两种有符号浮点数类型:Double表示64位浮点数。

  9. swift命令行项目SwiftBank学习

    新建名为SwiftBank的OSXComandline工程,会自动生成main.swift,再新建(+N)两个文件User.swift和Utils.swift内容分别为:main.swiftUtils.swiftUser.swift程序的入口不是main函数,而是main.swift文件,定义在这个文件中的代码会被顺次执行.总共有两屏的Menu外层是WelcomescreenMenu,内层是登录后

  10. Swift 中“等同性”、“比较”、“哈希” 概念理解

    甚至某些场景下还需要将其作为键值对中的Key,这就涉及到哈希函数以及哈希值的碰撞问题了。不过仔细查看代码,我们会发现上诉冲突的原因之一就是name、capital属性采用了同样的哈希函数。并修改Country中的哈希实现:改进后上诉冲突得以解决:总结本文简单的介绍了Swift中“等同性”、“比较”、“哈希”的概念,并对一些常见哈希冲突进行了分析。

随机推荐

  1. 从C到C#的zlib(如何将byte []转换为流并将流转换为byte [])

    我的任务是使用zlib解压缩数据包(已接收),然后使用算法从数据中生成图片好消息是我在C中有代码,但任务是在C#中完成C我正在尝试使用zlib.NET,但所有演示都有该代码进行解压缩(C#)我的问题:我不想在解压缩后保存文件,因为我必须使用C代码中显示的算法.如何将byte[]数组转换为类似于C#zlib代码中的流来解压缩数据然后如何将流转换回字节数组?

  2. 为什么C标准使用不确定的变量未定义?

    垃圾价值存储在哪里,为什么目的?解决方法由于效率原因,C选择不将变量初始化为某些自动值.为了初始化这些数据,必须添加指令.以下是一个例子:产生:虽然这段代码:产生:你可以看到,一个完整的额外的指令用来移动1到x.这对于嵌入式系统来说至关重要.

  3. 如何使用命名管道从c调用WCF方法?

    更新:通过协议here,我无法弄清楚未知的信封记录.我在网上找不到任何例子.原版的:我有以下WCF服务我输出添加5行,所以我知道服务器是否处理了请求与否.我有一个.NET客户端,我曾经测试这一切,一切正常工作预期.现在我想为这个做一个非托管的C客户端.我想出了如何得到管道的名称,并写信给它.我从here下载了协议我可以写信给管道,但我看不懂.每当我尝试读取它,我得到一个ERROR_broKEN_P

  4. “这”是否保证指向C中的对象的开始?

    我想使用fwrite将一个对象写入顺序文件.班级就像当我将一个对象写入文件时.我正在游荡,我可以使用fwrite(this,sizeof(int),2,fo)写入前两个整数.问题是:这是否保证指向对象数据的开始,即使对象的最开始可能存在虚拟表.所以上面的操作是安全的.解决方法这提供了对象的地址,这不一定是第一个成员的地址.唯一的例外是所谓的标准布局类型.从C11标准:(9.2/20)Apointe

  5. c – 编译单元之间共享的全局const对象

    当我声明并初始化一个const对象时.两个cpp文件包含此标头.和当我构建解决方案时,没有链接错误,你会得到什么如果g_Const是一个非const基本类型!PrintInUnit1()和PrintInUnit2()表明在两个编译单元中有两个独立的“g_Const”具有不同的地址,为什么?

  6. 什么是C名称查找在这里? (&amp;GCC对吗?)

    为什么在第三个变体找到func,但是在实例化的时候,原始变体中不合格查找找不到func?解决方法一般规则是,任何不在模板定义上下文中的内容只能通过ADL来获取.换句话说,正常的不合格查找仅在模板定义上下文中执行.因为在定义中间语句时没有声明func,并且func不在与ns::type相关联的命名空间中,所以代码形式不正确.

  7. c – 在输出参数中使用auto

    有没有办法在这种情况下使用auto关键字:当然,不可能知道什么类型的.因此,解决方案应该是以某种方式将它们合并为一个句子.这可用吗?解决方法看起来您希望默认初始化给定函数期望作为参数的类型的对象.您无法使用auto执行此操作,但您可以编写一个特征来提取函数所需的类型,然后使用它来声明您的变量:然后你就像这样使用它:当然,只要你重载函数,这一切都会失败.

  8. 在C中说“推动一切浮动”的确定性方式

    鉴于我更喜欢将程序中的数字保留为int或任何内容,那么使用这些数字的浮点数等效的任意算术最方便的方法是什么?说,我有我想写通过将转换放在解析的运算符树叶中,无需将表达式转化为混乱是否可以使用C风格的宏?应该用新的类和重载操作符完成吗?解决方法这是一个非常复杂的表达.更好地给它一个名字:现在当您使用整数参数调用它时,由于参数的类型为double,因此使用常规的算术转换将参数转换为double用C11lambda……

  9. objective-c – 如何获取未知大小的NSArray的第一个X元素?

    在objectiveC中,我有一个NSArray,我们称之为NSArray*largeArray,我想要获得一个新的NSArray*smallArray,只有第一个x对象…

  10. c – Setprecision是混乱

    我只是想问一下setprecision,因为我有点困惑.这里是代码:其中x=以下:方程的左边是x的值.1.105=1.10应为1.111.115=1.11应为1.121.125=1.12应为1.131.135=1.14是正确的1.145=1.15也正确但如果x是:2.115=2.12是正确的2.125=2.12应为2.13所以为什么在一定的价值是正确的,但有时是错误的?请启发我谢谢解决方法没有理由期望使用浮点系统可以正确地表示您的帖子中的任何常量.因此,一旦将它们存储在一个双变量中,那么你所拥有的确切的一

返回
顶部