城市直播房产教育博客汽车
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

大数据之HIVE入门(十四)

12月16日 飞虹谷投稿
  查询优化map端优化
  当join时有一个或多个小表可以装载进内存时可以使用mapjoin完成。
  第一种方法是可以加上mapjoin指示
  第二种方法是设置sethive。auto。convert。来让hive自动优化。同时可以指定
  sethive。auto。convert。join。默认开启
  sethive。auto。convert。join。noconditionaltask。size10000000;默认10M,可以根据需求做调整。
  hive。mapjoin。smalltable。filesize2500000;早期hive版本小表文件大小设置默认25M。
  selectMAPJOIN(timedim)count()fromstoresalesjointimedimon(sssoldtimeskttimesk);selectMAPJOIN(timedim,datedim)count()fromstoresalesjointimedimon(sssoldtimeskttimesk)joindatedimon(sssolddateskddatesk)wherethour8anddyear2002sethive。auto。convert。sethive。auto。convert。join。sethive。auto。convert。join。noconditionaltask。size10000000;selectcount()fromstoresalesjointimedimon(sssoldtimeskttimesk)
  当数据量比较大启动mapjoin后会造成问题请关闭groupby优化
  sethive。map。是否在Map端进行聚合,默认为T
  sethive。groupby。mapaggr。checkinterval100000000;在Map端进行聚合操作的条目数目数据查询主要原则:
  1、在关联操作前尽量减小数据集,能先聚合的先聚合、能过滤的先过滤(如设置查询条件、合理设置分区,有分区必须设置分区范围)。
  2、关联时数据类型要做到一致,如果不一致请用cast先转换类型。
  3、慎用count(distinct),容易产生数据倾斜,可以先groupby再count。
  4、减少小文件,合理设置输入文件大小、合理设置mapjob、reducejob数。
  sethive。merge。设置合并map文件标识。
  setmapred。max。split。size100000000;设置最大输入文件大小,大于此数值都会进行拆分。
  setmapred。min。split。size。per。node100000000;设置每个节点可处理的最小值。
  setmapred。min。split。size。per。rack100000000;设置每个机架可处理的最小值。
  sethive。input。formatorg。apache。hadoop。hive。ql。io。CombineHiveInputF执行前进行小文件合并。
  setmapred。reduce。tasks10;设置reduce的数量
  sethive。exec。reducers。bytes。per。reducer1073741824设置每个reduce所处理的数据大小
  5、选取字段避免用select,只引用你要用的字段,如selecta。uid,a。price。
  6、关联值有null值的情况下,可以将null值过滤出来单独处理或者将null值随机赋值。当存在某key有热点问题,也可以同样处理。
  7、合理设置数据模型、文件存储格式有利于查询效率优化。
  8、善用unionall合并对于同一个表的查询,有利于整体提高效率。
  9、合理使用中间临时表,数据量巨大时,如统计一年的数据,可先小规模聚合如按月聚合生成中间表,最后再合并统计出结果。
  10、有orderby要限制输出条数。
  11、合理设置并行查询
  sethive。exec。以开启并发执行。
  sethive。exec。parallel。thread。number10;同一个sql允许最大并行度,默认为8。
搜索 投诉 评论 转载

9月安全事件回顾前言从Defi安全角度来看9月安全事件相较于较8月份已有所下降,但是从整体安全角度来看依然不容乐观,黑客攻击涉及到的损失金额巨大。知道创宇区块链安全实验室总结了9月……你用过最有质感的手机是什么?感谢邀请你用过最有质感的手机是什么?题主问题的核心是你用过最有质感的手机是什么?实际我用过的手机很多,但是我觉得vivo的手机给我的印象是最好的,当然这不仅仅是从外观设计……阿里声明来了在网络暴力之下,公司选择牺牲小人物事情发酵之后,阿里高层第一时间声明,公司果断开除相关人员,看似正义,其实就是丢卒保车,司法机关调查取证尚未完成,案件还在审理中,直接表明……潮流兄弟齐上阵!坦克300携兄弟车型燃炸成都车展流量明星最怕啥?怕的就是新生代明星出场,夺走粉丝注意力。这个道理换到汽车上也一样,再好的车型只要遇到车展这种大型争奇斗艳的修罗场,都得为自己捏一把汗。除非,你是独一无二的又或者……可帮助盲人避开障碍物的人工智能控制鞋奥地利公司TecInnovation最近推出了智能鞋,该鞋使用超声波传感器帮助视力障碍患者检测最远4米远的障碍物。这款智能鞋被称为InnoMake,旨在成为世界各地数百万……Linux中Grep命令的常见示例,很全面Grep是一个强大的UNIX命令,可让您在文件内容中搜索各种参数。当您进行故障排除或调试时,它特别有用。grep命令有大量的选项和用例。您可能永远不需要或使用所有这些。但……学习笔记一单片机定时器计数器查询法实现LED灯闪烁includereg51。hincludeintrins。hvoidtimer0Init();sbitLEDP34;voidmain(){t……大数据之HIVE入门(十四)查询优化map端优化当join时有一个或多个小表可以装载进内存时可以使用mapjoin完成。第一种方法是可以加上mapjoin指示第二种方法是设置sethiv……国产机能否冲击高端?四千字详解iPhone13与荣耀Magi如果你有七千块,会入手一部256G的苹果13,还是一部荣耀Magic4Pro加上一块荣耀手表再加一个荣耀蓝牙耳机,这一套的电子大礼包呢。面对国产手机疯狂的堆料升级配置,苹果用户……京东取消周报,员工欢呼终于不用写论文了上周,京东内部员工沸腾了。京东在外界眼里,是第一家员工人数超过40万人的互联网企业,是把员工福利和薪酬放在第一位的好企业,这样的基础,已经远超其他企业,而京东每次做出的决……冬季电费HOLD不住,我家最费电的东西是这5个,快看看你家有今天上午家里突然停电,检查后发现是电费用完了。查看了一下账单,距离上次充值500元电费,只过去了不到一个月。冬季电费,实在是让人hold不住!仔细想想,为什么这个月电费这……经济日报携手京东发布数据预制菜消费持续走高数据来源京东消费及产业发展研究院用品质和安全赢得市场近两年,预制菜可谓是食品市场上的一匹黑马,不仅品种丰富、口味多样,消费持续走高,诸多上下游企业也纷纷入局。预制菜……
第一次去相亲,对方女孩开口就要苹果手机12,该不该满足她呢?realmeGT2Pro(8GB128GB5G版)怎么样?新造车开门红小鹏连夺月冠,蔚来未破万辆掉队了?华大北斗与中材贸易达成战略合作,共促北斗全球应用蓬勃发展华为鸿蒙系统升级到最新版2。0。0。236,手机出现发热异常互联网布局菜篮子?种子却被西方垄断,关键还得看任正非兄弟支付宝芝麻分750分以上都是什么人?有什么特别的用处吗?自吸发动机即将淘汰3缸发动机将成为主流特斯拉比亚迪成最大赢家鸿蒙OS最新内测名单公布,众多机型皆可申请,荣耀手机也能升级iPhone14规格被泄露,无缘A16处理器,价格是最大悬念vivoTWS2上手评测百元价位,千元体验爱奇艺裁员四成左右,两种离职赔偿方案,股价还一度涨了
尔湾纪行13独立民居2热评聚热点网 怎样在男人面前保持神秘感女人一定要看按揭贷款哪个银行好吃鸡蛋也会变老错误吃法你是我的荣耀学神于途面临中年之危,乔晶晶发萌兔求大佬带飞女人到了50岁,建议秋天多穿这4双鞋,精致时髦又显气质面霜推荐这几款面霜真心推荐给你哦北大博士送外卖,揭开了世界的真相我是一个头顶草原的男人封神演义小娥结局是什么小娥重生化为女祭司以丰收为题的小学作文绝顶经典观后感集

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找江西南阳嘉兴昆明铜陵滨州广东西昌常德梅州兰州阳江运城金华广西萍乡大理重庆诸暨泉州安庆南充武汉辽宁