当前位置: 首页 > 数据结构&&算法 > 正文

散列表

                                                                                        散列表

  前几天看《linux内核设计与实现》的时候,发现一个新名词(对于我来说)“散列表”,直接给我看蒙住了,散列表是个什么鬼,于是今天晚上找了本数据结构的书,来学习下散列表这个新东西。

      散列表:

                   既是一种存储的技术,又是一种查找的技术,也就是说可以用它来查找与存储,不同于一般的存储与查找,一般正常的存储,举个例子一个已经存在的数组,其中每一个数据内容与它的下标都是一一对应的关系,需要查找时就进行一次遍历要么找到,要么没找到。很直接,要找的内容都是固定的,但是散列表并不用来处理这类查找。散列表把你需要查找的关键字与其下标建立了一种关系,就像上面所说过的,一个数组的下标和它里面存在的内容没有半毛钱的关系。但是散列表则不然,散列表把存储的东西与下标建立了一种有规则的关系,这种规则你自己定。但是定的方法很讲究,一会再说。

   还是给一个关于散列表的官方定义吧

   散列表:

散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表
给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。
 以上定义来自百度百科。
   其实和我说的差不多,那个有规则的关系就是哈希函数。可以同时定义多个哈希函数。
现在来说说散列表的构造方法:
    直接定址法:
取关键字的某个线性函数值为散列表地址
         f(key) = a * key + b;
   数字分析法:
         将某些特定的数字进行处理,例如131XXXXX1234,132XXXXX6789.。。。。例如这些手机号,其实只有后边的4位数字是相同的那么我们,就应当取处后面的4位进行比较甄别。
         简单来说就是屏蔽掉重复的数字,主要处理那些能够表征问题的数字。
平方取中法:
          就是如字面意思将一个数字平方然后取中间的某几位数字,其实做了这么多只是为了排除那些重复的关键字,这是我们的原则,根据不同的需求选择不同的哈希方法,如果有人可以想出万用的哈希函数,那么也不失为一个壮举。
 除留余数法:
         就是给定的东西取余,得出余数,以余数作为存储的下标,当然余数是很可能相同的所以如果出现相同的情况就对除数+1,一直这样下去,直到找出可以放置的位置为止。
还有随机数法,溢出数表。。。。。多种方法,原则就是打造出适合问题的哈希函数。
下面贴上一个代码:就是使用余数法建议一个散列表,这个散列表初始化位5个存储位置,首先进行5个数字的存入操作,然后可以输入一个数字,查找出它在散列表中的存储位置。


版权声明:本文为博主原创文章,未经博主允许不得转载。

]]>

本文固定链接: http://zmrlinux.com/2015/06/16/%e6%95%a3%e5%88%97%e8%a1%a8/ | Kernel & Me

该日志由 root 于2015年06月16日发表在 数据结构&&算法 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: 散列表 | Kernel & Me
【上一篇】
【下一篇】