自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 资源 (293)
  • 论坛 (42)
  • 收藏
  • 关注

原创 Twitter 如何将 Kafka 当做一个存储系统

前言当开发人员通过我们提供的 API 使用公开的 Twitter 数据时,他们需要可靠性、高效的性能以及稳定性。因此,在前一段时间,我们为 Account Activity API 启动...

2020-12-31 08:52:52 54 1

转载 PrestoSQL 项目更名为 Trino,彻底和 PrestoDB 分家

2020年12月27日,Martin Traverso、 Dain Sundstrom 以及 David Phillips 大佬们宣布将 PrestoSQL 项目的名字更名为 Trino...

2020-12-30 09:00:00 716

转载 ClickHouse在京东流量分析的应用实践

前言ClickHouse 是一款开源列式存储的分析型数据库,相较业界OLAP数据库系统,其最核心优势就是极致的查询性能。它实现了向量化执行和SIMD指令,对内存中的列式数据,一个batc...

2020-12-29 09:40:18 685

转载 还有多久 Flink 会取代 Spark?先看看 Flink 流批一体有多牛吧!

身为大数据工程师,你还在苦学Spark、Hadoop、Storm,却还没搞过Flink?醒醒吧!刚过去的2020双11,阿里在Flink实时计算技术的驱动下全程保持了“如丝般顺滑”,基于...

2020-12-28 09:00:00 270

转载 携程 Redis 治理演进之路

作者简介本文为联合撰稿,作者团队包括:布莱德,携程技术专家;向晨,携程数据库专家;骋成,携程技术专家;小峰,携程高级软件工程师。一、背景携程Redis集群规模和数据规模在过去几年里快速...

2020-12-28 09:00:00 60

原创 Apache Kafka 2.7.0 稳定版发布,有哪些值得关心的变化?

Apache Kafka 2.7.0 于2020年12月21日正式发布,这个版本是目前 Kafka 最新稳定版本,大家可以根据需要自行决定是否需要升级到次版本,关于各个版本升级到 Apa...

2020-12-27 20:35:07 5814 3

转载 Flink Forward Asia 2020 -- Keynote 总结

作者:王峰(莫问)、梅源剩喜漫天飞玉蝶,不嫌幽谷阻黄莺。2020 年是不寻常的一年,Flink 也在这一年迎来了新纪元。12 月13 – 15 号,2020 Flink Forward...

2020-12-26 08:59:00 80

转载 详解分布式协调服务 ZooKeeper,再也不怕面试问这个了

ZooKeeper 是一个分布式协调服务,由 Apache 进行维护。ZooKeeper 可以视为一个高可用的文件系统。ZooKeeper 可以用于发布/订阅、负载均衡、命令服务、分布...

2020-12-25 09:04:37 95

转载 eBay 广告数据平台的 OLAP 系统演进实战

01背景eBay广告数据平台为eBay第一方广告主(使用Promoted Listing服务的卖家)提供了广告流量、用户行为和效果数据分析功能。广告卖家通过卖家中心(Seller Hu...

2020-12-24 08:52:00 73

转载 最新大数据资料合集.pdf

下载方式:关注下方公众号,回复888

2020-12-23 09:00:00 140

转载 滴滴在HBase性能与可用性上的探索与实践

导读:HBase作为Hadoop生态中表现较为突出的分布式在线数据存储产品,在滴滴有着非常广泛的应用,但同样存在比较突出的短板问题——例如可用性较弱、毛刺严重等,一定程度上限制了它的业务...

2020-12-23 09:00:00 50

转载 想入行大数据领域,学习路线怎么规划?

自从“大数据”成为国民热词以来,想入行的人越来越多,不管是为了提高收入还是兴趣使然,只要是想学习新的知识,就必须有套系统的学习路线。本文整理了大数据领域入门必学的一些知识点,以及每个知识...

2020-12-23 09:00:00 155 1

转载 10小时,就能吃透Kafka源码?

在大数据时代飞速发展的当下,Kafka凭借着其高吞吐低延迟、高压缩性、持久性、可靠性、容错性以及高并发的优势,解决了“在巨大数据下进行准确收集并分析”的难题,也受到了不少大厂以及工程师的...

2020-12-22 09:00:00 126

转载 Presto 在有赞的实践之路

本文主要介绍了 Presto 的简单原理,以及 Presto 在有赞的实践之路。一、Presto 介绍Presto 是由 Facebook 开发的开源大数据分布式高性能 SQL 查询引擎...

2020-12-22 09:00:00 357

转载 Flink 还是 Spark?阿里技术专家一语道破真相!

身为大数据工程师,你还在苦学Spark、Hadoop、Storm,却还没搞过Flink?醒醒吧!刚过去的2020双11,阿里在Flink实时计算技术的驱动下全程保持了“如丝般顺滑”,基于...

2020-12-21 09:00:00 196

转载 贝壳找房 OLAP 平台实践

Kylin 在贝壳的使用情况介绍Kylin从2017年开始作为贝壳公司级OLAP引擎对外提供服务,目前有100多台Kylin实例;有800多个Cube;有300多T的单副本存储;在贝壳 ...

2020-12-21 09:00:00 218

转载 Apache Flink 1.12.0 正式发布,真正的流批一体

‍‍Apache Flink 社区很荣幸地宣布 Flink 1.12.0 版本正式发布!近 300 位贡献者参与了 Flink 1.12.0 的开发,提交了超过 1000 多个修复或优化...

2020-12-20 21:07:00 1405

转载 万亿级数据应该怎么迁移?

背景在星爷的《大话西游》中有一句非常出名的台词:“曾经有一份真挚的感情摆在我的面前我没有珍惜,等我失去的时候才追悔莫及,人间最痛苦的事莫过于此,如果上天能给我一次再来一次的机会,我会对哪...

2020-12-19 09:30:00 87 1

原创 Presto在车好多的实践

本文作者:车好多大数据OLAP团队-王培Presto 简介1.简介Presto 最初是由 Facebook 开发的一个分布式 SQL 执行引擎, 它被设计为用来专门进行高速、实时的数据分...

2020-12-18 08:22:00 4447 7

转载 推荐一个不发广告的大数据公众号

公众号无疑是最方便、最直接的获取内容的方式,奈何很多公众号为了生存,不得不接一些广告,虽说不发广告的时候,技术文章质量很高,但到底是影响阅读体验。现如今,还有没有一个纯净的、只发干货文章...

2020-12-18 08:22:00 63 1

转载 Clickhouse的实践之路

导读在数据量日益增长的当下,传统数据库的查询性能已满足不了我们的业务需求。而Clickhouse在OLAP领域的快速崛起引起了我们的注意,于是我们引入Clickhouse并不断优化系统性...

2020-12-17 09:00:00 2538 1

转载 如何转行大数据方向?

经常有同学在后台留言问我,自己觉得大数据行业薪资很高,想往大数据方向发展,但不知道该学哪些知识,应该具备的技能树是啥样的。迷茫和焦虑都要溢出屏幕了……如果觉得薪资高就业好,想往大数据方向...

2020-12-16 09:00:00 129

转载 Spark SQL 查询 Parquet 文件的性能提升 30%,字节是如何做到的?

本文来自11月举办的Data + AI Summit 2020(原 Spark+AI Summit),主题为《Improving Spark SQL Performance by 3...

2020-12-16 09:00:00 299

转载 AI论文选得好,工资老婆都会好!

搞AI,在不断精进自己代码的同时,更应该提升自己的阅读能力。需要不断地阅读大量的最新、最前沿的论文,也要深扎经典论文根基。因为阅读论文可以帮助你深入原理,理解AI更前沿的发展状态,掌握更...

2020-12-15 09:00:00 29

转载 漫话docker的衰落与kubernetes的兴起

伴随着kubernetes 1.20中对于docker的弃用,关于docker的灭亡与kubernetes的兴起的话题再度热了起来。讨论中关于docker灭亡的观点我不敢苟同。docke...

2020-12-15 09:00:00 48

转载 58同城用户行为数仓建设及实践

背景随着58业务体系的不断建设与发展,数据分析与应用需求越来越丰富,给数据仓库的建设工作带来了很大的挑战。全站行为数据仓库建设过程中,我们总结的问题包括如下几点:(1) 数据体系架构已经...

2020-12-14 09:00:00 105

原创 物化列:字节为解决 Spark 嵌套列查询性能低下的优化

本文来自11月举办的Data + AI Summit 2020(原 Spark+AI Summit),主题为《Materialized Column- An Efficient Wa...

2020-12-13 21:18:30 120

转载 IntelliJ IDEA 2020.3 正式版发布,多项超酷新功能

2020年12月01日,IntelliJ IDEA 2020.3 正式发布,这是2020年的第三个里程碑版本本文主要介绍 IntelliJ IDEA 2020.3 的新功能。用户体验重新...

2020-12-12 21:04:00 2496 1

转载 Redis有啥可牛的?

如果你是一位后端工程师,面试时八成会被问到 Redis,特别是那些大型互联网公司,不仅要求面试者能简单使用 Redis,还要深入理解其底层实现原理,具备解决常见问题的能力。可以说,熟练使...

2020-12-11 09:17:28 85

转载 Spark-Redis入门到解决执行海量数据插入、查询作业时碰到的问题

Spark 是专为大规模数据处理而设计的快速通用的计算引擎,起源于UC Berkeley AMP lab的一个研究项目。相比传统的Hadoop(MapReduce) ,Spark的性能快...

2020-12-11 09:17:28 310

转载 恭喜!新一代分布式对象存储 Ozone 成为顶级项目

刚刚获悉,Apache基金董事会通过一致表决,正式批准分布式文件对象存储Ozone从Hadoop社区孵化成功,成为独立的Apache顶级开源项目。这意味着,作为腾讯大数据团队首个参与和主...

2020-12-10 09:07:00 284

转载 HDFS 下一代对象存储 Ozone 在腾讯的使用

背景介绍腾讯目前在HDFS上存储了海量的数据,但HDFS在可扩展性上的缺陷,以及对小文件的不友好,限制了HDFS在许多场景下的应用。为了寻找能解决这些问题的存储系统,Ozone走入了我们...

2020-12-09 09:01:22 275

转载 10PB 规模的 HDFS 数据在 eBay 的迁移实战

导读INTRODUCTIONHadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件上的分布式文件系统(Distributed File System)。本文将介绍eBay ...

2020-12-08 09:00:00 119

转载 你为什么总学不会设计模式?

设计模式对你来说,应该不陌生。在面试中,经常会被问到,在工作中也会用到。一些设计模式书籍,比如大名鼎鼎的GoF的《设计模式》、通俗易懂的《Head First设计模式》,估计你也都研读过...

2020-12-08 09:00:00 69

转载 京东EB级全域大数据平台的演进与治理历程

讲师介绍包勇军,目前在京东任职数据基础平台部、广告质量部、推荐研发部负责人,同时担任京东集团技术委员会委员、京东零售数据算法委员会会长。负责大数据平台基础架构的建设和产品开发、AI算法平...

2020-12-07 09:00:00 163

原创 Data + AI Summit 欧洲2020全部超清 PPT 下载

Data + AI Summit Europe 2020 原 Spark + AI Summit Europe 于2020年11月17日至19日举行。由于新冠疫情影响,本次会议和六月份举...

2020-12-06 21:11:57 157

转载 为什么全网都劝你不要学C++?

学C++能干什么?往细了说,后端、客户端、游戏引擎开发以及人工智能领域都需要它。往大了说,构成一个工程师核心能力的东西,都在C++里。跟面向对象型的语言相比,C++是一门非常考验技术想...

2020-12-06 21:11:57 208

转载 年底看机会,欢迎加入Java大数据招聘群!

欢迎加入群【Java-大数据招聘求职信息群】【已发布职位】加群请确认已关注公众号:Java与大数据架构在上面的公众号后台回复:666 获取进群方式(如群满,请加个人微信拉你进群:del...

2020-12-05 22:08:53 86

转载 基于 Flink+Iceberg 构建企业级实时数据湖

Apache Flink 是大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构。那么当 Apache Flink 遇见数据湖时,会碰撞出什么样的火花呢?本次...

2020-12-04 08:26:00 226

转载 分布式搜索引擎Elasticsearch的架构分析

一、写在前面ES(Elasticsearch下文统一称为ES)越来越多的企业在业务场景是使用ES存储自己的非结构化数据,例如电商业务实现商品站内搜索,数据指标分析,日志分析等,ES作为...

2020-12-03 09:00:00 107

Qcon北京2018-《阿里巴巴微服务技术实践》-朱勇.pdf

随着业务的不断发展,传统的应用开发部署模式,在满足业务快速试错的要求下,将会面临开发效率低下、部署运维不规范等诸多问题。而业界微服务的事实标准Spring Boot也在不断流行,因此我们有必要将其与阿里现有的技术栈无缝融合。 在整个融合的过程中,需要保持技术架构一致性,并提升开发体验,因此我们总结了一些经验和教训。本次分享,即为大家带来我们在这些背后的一些思考。 听众受益 阿里服务化架构演进; Java隔离容器Pandora; 微服务框架Pandora Boot; 微服务运维与诊断。

2018-05-16

应用随机过程讲义中文版

应用随机过程讲义 中文版 应用随机过程讲义 中文版

2011-08-16

Unity AI Game Programming - Second Edition.pdf

Unity 5 provides game and app developers with a variety of tools to implement artificial intelligence. Leveraging these tools via Unity’s API or built-in features allows limitless possibilities when it comes to creating your game’s worlds and characters. Whether you are developing traditional, serious, educational, or any other kind of game, understanding how to apply artificial intelligence can take the fun-factor to the next level! This book helps you break down artificial intelligence into simple concepts to give the reader a fundamental understanding of the topic to build upon. Using a variety of examples, the book then takes those concepts and walks you through actual implementations designed to highlight key concepts, and features related to game AI in Unity 5. Along the way, several tips and tricks are included to make the development of your own AI easier and more efficient. Starting from covering the basic essential concepts to form a base for the later chapters in the book, you will learn to distinguish the state machine pattern along with implementing your own. This will be followed by learning how to implement a basic sensory system for your AI agent and coupling it with a finite state machine (FSM). Next you will be taught how to use Unity’s built-in NavMesh feature and implement your own A* pathfinding system. Then you will learn how to implement simple flocks and crowd’s dynamics, the key AI concepts. Then moving on you will learn how a behavior tree works and its implementation. Next you will learn adding layer of realism by combining fuzzy logic concepts with state machines. Lastly, you learn applying all the concepts in the book by combining them in a simple tank game.

2017-02-16

SPARK + AI SUMMIT 2019 全部 PPT

为期三天的 SPARK + AI SUMMIT 2019 于 2019年04月23日-25日在旧金山(San Francisco)进行。数据和 AI 是需要结合的,而 Spark 能够处理海量数据的分析,将 Spark 和 AI 进行结合,无疑会带来更好的产品。作为大数据领域的顶级会议,Spark+AI Summit 2019 吸引了全球大量技术大咖参会,而且 Spark+AI Summit 越做越大,本次会议议题快接近200多个。详情:https://www.iteblog.com/archives/2431.html

2019-09-21

Apache Doris (Incubating) 原理与实践.pdf

Doris(原百度 Palo)是一款基于大规模并行处理技术的分布式 SQL 数据库,由百度在 2017 年开源,2018 年 8 月进入 Apache 孵化器。

2019-12-10

Learning PySpark

本书将向您展示如何利用Python的强大功能并将其用于Spark生态系统中。您将首先了解Spark 2.0的架构以及如何为Spark设置Python环境。通过本书,你将会使用Python操作RDD、DataFrames、MLlib以及GraphFrames等;在本书结束时,您将对Spark Python API有了全局的了解,并且学习到如何使用它来构建数据密集型应用程序。通过本书你将学习到以下的知识: 1、Learn about Apache Spark and the Spark 2.0 architecture 2、Build and interact with Spark DataFrames using Spark SQL 3、Learn how to solve graph and deep learning problems using GraphFrames and TensorFrames respectively 4、Read, transform, and understand data and use it to train machine learning models 5、Build machine learning models with MLlib and ML 6、Learn how to submit your applications programmatically using spark-submit 7、Deploy locally built applications to a cluster 本书由Tomasz Drabas所著,全书共380页;Packt Publishing出版社于2017年02月出版。

2018-05-02

K-Means算法C语言实现

这是我用C语言编写的数据挖掘里面的一个K-Means算法,里面有截图。

2011-12-02

Advanced Python for Biologists

Advanced Python for Biologists is a programming course for workers in biology and bioinformatics who want to develop their programming skills. It starts with the basic Python knowledge outlined in Python for Biologists and introduces advanced Python tools and techniques with biological examples. You’ll learn: – How to use object-oriented programming to model biological entities – How to write more robust code and programs by using Python’s exception system – How to test your code using the unit testing framework – How to transform data using Python’s comprehensions – How to write flexible functions and applications using functional programming – How to use Python’s iteration framework to extend your own object and functions Advanced Python for Biologists is written with an emphasis on practical problem-solving and uses everyday biological examples throughout. Each section contains exercises along with solutions and detailed discussion.

2018-04-21

浪漫烟花JAVA源代码.rar

这是一份浪漫烟花JAVA源代码,运行效果蛮好看的,

2009-06-03

高可用性的HDFS:Hadoop分布式文件系统深度实践

本书专注于Hadoop 分布式文件系统(HDFS)的主流HA 解决方案,内容包括:HDFS 元数据解析、Hadoop 元数据备份方案、Hadoop Backup Node 方案、AvatarNode 解决方案以及最新的HA 解决方案Cloudrea HA Name Node 等。其中有关Backup Node 方案及AvatarNode 方案的内容是本书重点,尤其是对AvatarNode 方案从运行机制到异常处理方案的步骤进行了详尽介绍,同时还总结了各种异常情况下AvatarNode 的各种处理方案。

2013-11-29

用c语言实现哈夫曼编码

这是那个用c语言来实现的哈夫曼编码程序,可以对输入的数据进行相应的编码……

2009-05-31

The Delta Architecture Delta Lake + Apache Spark Structured Streaming.pdf

数据工程师的纠结与运维的凌乱 • Delta Lake基本原理 • Delta 架构 • Delta 架构的特性 • Delta 架构的经典案例 & Demo • Delta Lake 社区

2019-10-28

Windows GUI高级编程(C#编程篇) 英文版

本书以GUI编程为重点,详细介绍了.NET下的Windows编程技术。主要内容涉及使用或不使用Visual Studio.NET创建Windows应用程序、运用Windows Forms类和控件、高级的数据绑定、处理用户输入、使用GDI+绘图、打印和打印预览、创建自定义控件、NET中的多线程编程,以及部署Windows应用程序等。 本书适合于具有一定.NET和C#编程经验,但希望了解有关如何在Windows应用程序中使用新的开发技术的程序员。并且读者应有使用MFC或Visual编写Windows应用程序的

2011-08-16

HBase在贝壳找房的应用实践

介绍贝壳基于hbase在多维分析(kylin),楼盘字典等核心项目的应用,并分享在实践过程中遇到的问题和性能优化经验。

2018-08-13

Windows应用高级编程-C#编程篇 源代码

Windows应用高级编程-C#编程篇张哲峰译 (developing c# windows software --source code) 我最近在学习这本书 但是死活找不到源码 所以在看书的时候一字一字的敲进去了,现在分享给大家。 里面有1-9章的源代码

2011-08-16

MySQL 8 Cookbook

MySQL 8 Cookbook: Over 150 recipes for high-performance database querying and administration Design and administer enterprise-grade MySQL 8 solutions MySQL is one of the most popular and widely used relational databases in the World today. The recently released MySQL 8 version promises to be better and more efficient than ever before. This book contains everything you need to know to be the go-to person in your organization when it comes to MySQL. Starting with a quick installation and configuration of your MySQL instance, the book quickly jumps into the querying aspects of MySQL. It shows you the newest improvements in MySQL 8 and gives you hands-on experience in managing high-transaction and real-time datasets. If you’ve already worked with MySQL before and are looking to migrate your application to MySQL 8, this book will also show you how to do that. The book also contains recipes on efficient MySQL administration, with tips on effective user management, data recovery, security, database monitoring, performance tuning, troubleshooting, and more. With quick solutions to common and not-so-common problems you might encounter while working with MySQL 8, the book contains practical tips and tricks to give you the edge over others in designing, developing, and administering your database effectively. What You Will Learn Install and configure your MySQL 8 instance without any hassle Get to grips with new features of MySQL 8 like CTE, Window functions and many more Perform backup tasks, recover data and set up various replication topologies for your database Maximize performance by using new features of MySQL 8 like descending indexes, controlling query optimizer and resource groups Learn how to use general table space to suit the SaaS or multi-tenant applications Analyze slow queries using performance schema, sys schema and third party tools Manage and monitor your MySQL instance and implement efficient performance-tuning tasks

2018-04-27

Spark SQL 在字节跳动的优化实践-郭俊.pdf

Spark 在字节跳动内部扮演着重要角色。在数据仓库领域,Spark SQL 正在逐渐取代 Hive 成为主要的 ETL 计算引擎,另外它还是字节跳动内部重要的 ad-hoc 查询引擎。目前 Spark 每天处理百万亿级数据,单任务 Shuffle 数据量可超过 200TB。同时 Spark 与其它系统混合部署,因此性能与稳定性都是需要重点解决的问题。本次分享将会基于基础架构团队过往的工作成果,介绍字节跳动在提升基于 Spark SQL 的 ETL 稳定性以及优化 ad-hoc 查询的性能方面的实践。

2019-12-03

CSDN博客提取器修正版

本程序用java编写,运行的时候需要JDK1.5或以上环境,无需安装。程序通过分析CSDN博客源码来生成一些必要的数据,可能在以后使用当中出现爬取不了的情况,可能是CSDN的源码结构修改了。程序只是用于学习之用,严禁用于非法目的而照成CSDN服务器过载。 由于生成PDF的时候需要依赖字库,所以在打包程序的时候把一些必要的字库已经放到程序中去了。可能在生成一些PDF文件的时候出现乱码问题,那是因为里面缺少需要的字库,如遇到这个问题,请和本人联系wyphao.2007@163com #################################################### 程序功能: 1、支持输入CSDN博客用户名针对性下载 2、支持选择保存下载的文件 保存的结构目录为: 选择的保存路径\CSDN用户名\img 该用户的头像保存路径 选择的保存路径\CSDN用户名\pdf 生成的PDF文件保存路径 选择的保存路径\CSDN用户名\doc 生成的DOC文件保存路径 选择的保存路径\CSDN用户名\txt 生成的TXT文件保存路径 3、支持获取用户博客信息 4、支持显示用户所有的帖子列表 5、可以自己选择需要下载的帖子,有全选、反选、重置按钮 6、支持下载的文件保存为 pdf、doc、txt三种格式 7、生成的pdf、doc文件支持图片 8、支持进度显示 #################################################### 制作时间:2012年07月17日 - 2012年07月18日 制 作:w397090770 个人博客:http://blog.csdn.net/w397090770 Email :wyphao.2007@163.com 版权所有,翻版不究 ####################################################

2012-07-19

Real Time Recommendations using Spark Streaming

Real Time Recommendations using Spark Streaming

2017-03-31

Delta Lake: HighPerformance ACID Table Storage over Cloud Object Stores

Delta Lake: HighPerformance ACID Table Storage over Cloud Object Stores

2020-08-24

Hadoop in Practice

《Hadoop in Practice》英文完整版,没有找到中文的,需要的下载吧

2013-12-02

QCon北京2018-《TiDB架构与开源之路》-申砾.pdf

TiDB架构与开源之路,TiDB架构与开源之路,TiDB架构与开源之路

2018-05-16

Apache Spark 3.0, Koalas, Delta Lake 最新进展

In this talk, we will highlight major efforts happening in the Spark ecosystem. In particular, we will dive into the details of adaptive and static query optimizations in Spark 3.0 to make Spark easier to use and faster to run. We will also demonstrate how new features in Koalas, an open source library that provides Pandas-like API on top of Spark, helps data scientists gain insights from their data quicker.

2019-10-28

QCon北京2018-《JVM问题定位典型案例分析》-李嘉鹏.pdf

JVM体系很庞大,涉及的知识点非常多,对于平时工作繁忙的我们往往没有时间和精力去有系统有条理地学习和掌握所有的这些知识,我的一个比较好的途径是不断给大家解决一些JVM相关的问题,在解决问题过程中去填充JVM领域的一些空白,让JVM的知识图谱越来越连贯,通过这次分享我希望能介绍几个曾经碰到的有意思的JVM案例让大家更好地了解JVM里的一些原理。

2018-05-16

机器学习十大算法:kNN

机器学习十大算法:kNN 机器学习十大算法:kNN

2012-02-21

Learning Spark SQL

Design, implement, and deliver successful streaming applications, machine learning pipelines and graph applications using Spark SQL API

2018-04-23

离散数学清华经典版本

离散数学清华经典版本耿素云等编著,很经典的。

2011-12-24

CSDN博客提取器

本程序用java编写,运行的时候需要JDK1.5或以上环境,无需安装。程序通过分析CSDN博客源码来生成一些必要的数据,可能在以后使用当中出现爬取不了的情况,可能是CSDN的源码结构修改了。程序只是用于学习之用,严禁用于非法目的而照成CSDN服务器过载。 由于生成PDF的时候需要依赖字库,所以在打包程序的时候把一些必要的字库已经放到程序中去了。可能在生成一些PDF文件的时候出现乱码问题,那是因为里面缺少需要的字库,如遇到这个问题,请和本人联系wyphao.2007@163com #################################################### 程序功能: 1、支持输入CSDN博客用户名针对性下载 2、支持选择保存下载的文件 保存的结构目录为: 选择的保存路径\CSDN用户名\img 该用户的头像保存路径 选择的保存路径\CSDN用户名\pdf 生成的PDF文件保存路径 选择的保存路径\CSDN用户名\doc 生成的DOC文件保存路径 选择的保存路径\CSDN用户名\txt 生成的TXT文件保存路径 3、支持获取用户博客信息 4、支持显示用户所有的帖子列表 5、可以自己选择需要下载的帖子,有全选、反选、重置按钮 6、支持下载的文件保存为 pdf、doc、txt三种格式 7、生成的pdf、doc文件支持图片 8、支持进度显示 #################################################### 制作时间:2012年07月17日 - 2012年07月18日 制 作:w397090770 个人博客:http://blog.csdn.net/w397090770 Email :wyphao.2007@163.com 版权所有,翻版不究 ####################################################

2012-07-19

完整的JSP网站图书管理系统源码

这是我在大学做课程设计时制作的图书馆管理系统全部的源码 里面包括本系统所要的所有jar包,还有建的表,上次上来给大家分享。

2010-05-01

关于运动会分数统计系统数据结构 课程设计实验报告

关于运动会分数统计系统 数据结构 课程设计实验报告,全部源代码下载

2010-01-03

计算机网络第五版教材

计算机网络第五版pdf教材高清版 谢希仁

2011-11-19

百度文库免积分下载器(绿色版)

本软件包含: 文档分类、文档搜索、文档预览、文档复制粘贴、文档下载保存5大功能.,可以免费下载百度文库中所有的文档,包括收费的和免费的!不需登录,不需要积分财富值,一切轻松下载。 1、百度文库下载器 采用 Microsoft Visual Studio 2010 C# 开发,性能好,速度快,需要 .Net Framework 4 支持. 2、如果你的电脑未安装 .Net Framework 4,就无法运行软件,因此,请先安装后再运行本软件。 3、.Net Framework 4 下载地址:http://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=0A391ABD-25C1-4FC0-919F-B21F31AB88B7 支持下载原版文档,包括文档格式和PPT图片等等,实现了完美下载!目前是互联网上唯一能够免费下载百度文库真正的原版文档。 10.8版本,升级内容: 因为百度和360搜索大站,百度改版,导致本软件原搜索失效,现在已经修复。截图依旧采用8.0版本,软件已更新。

2012-12-25

Lucene实战(第2版)中文版(免积分)

Lucene实战(第2版) 《lucene实战(第2版)》基于apache的lucene3.0,从lucene核心、lucene应用、案例分析3个方面详细系统地介绍了lucene,包括认识lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用tika提取文本、lucene的高级扩展、使用其他编程语言访问lucene、lucene管理和性能调优等内容,最后还提供了三大经典成功案例,为读者展示了一个奇妙的搜索世界。   《lucene实战(第2版)》适合于已具有一定java编程基本的读者,以及希望能够把强大的搜索功能添加到自己的应用程序中的开发人员。lucene实战(第2版)》对于从事搜索引擎工作的工程技术人员,以及在java平台上进行各类软件开发的人员和编程爱好者,也具有很好的学习参考价值。

2013-08-05

Hadoop实战-陆嘉恒

Hadoop实战-陆嘉恒,书比较入门级,入门的人可以看看

2013-12-02

SQL-DFS:一种基于HDFS 的海量小文件存储系统

针对Hadoop 分布式文件系统(Hadoop distributed file system,HDFS)进行小文件存储时NameNode 内存占用率高的问题,通过分析HDFS 基础架构,提出了基于元数据存储集群的SQL-DFS 文件系统. 通过在NameNode 中加入小文件处理模块实现了小文件元数据由NameNode 内存到元数据存储集群的迁移,借助关系数据库集群实现了小文件元数据的快速读写,并对小文件读取过程进行优化,减少了文件客户端对NameNode 的请求次数;通过将部分DataNode 文件块的校验工作交由元数据存储集群完成,进一步降低了NameNode 节点的负载压力. 最终通过搭建HDFS 和SQL-DFS 实验平台,对HDFS 和SQL-DFS 2 种架构进行了小文件读写的对比测试,实验结果表明:SQLDFS在文件平均耗时(file average cost,FAC)和内存占用率方面均明显优于原HDFS 架构,具有更好的小文件存储能力,可用于海量小文件的存储.

2018-04-23

spark Streaming和structed streaming分析

spark Streaming和structed streaming分析,理解整个 Spark Streaming 的模块划分和代码逻辑。

2018-04-23

QCon北京2018-《Dubbo开源现状与未来规划》-罗毅.pdf

Dubbo是阿里巴巴自研的分布式服务框架,自2012年开源以来,深得开发人员的喜爱,并被广泛的被友商用于服务化解决方案中。自去年阿里巴巴中间件团队宣布重新维护依赖,在社区引起极大的反响,目前在github上的star数增加至15000。本次分享,为大家带来我们近期在Dubbo上所完成的一些工作,对Dubbo 3.0的规划,以及对积极推动开源的一些思考。

2018-05-15

HBase Procedure V2介绍

主要介绍一下Procedure V2的设计和结构,以及为什么用Procedure V2能比较容易实现出正确的AssignmentManager。最后介绍一下最近在2.1分支上对一些Procedure实现修正和改进。

2018-08-13

Spark AI Summit Europe 2018 全部PPT

Spark AI Summit Europe 2018 全部PPT,如有更新请关注https://www.iteblog.com/archives/2432.html

2018-10-13

Spark AI Summit Europe 2018 全部PPT - part1

Spark AI Summit Europe 2018 全部PPT,如有更新请关注https://www.iteblog.com/archives/2432.html

2018-10-13

过往记忆的留言板

发表于 2020-01-02 最后回复 2020-01-02

java读取网页保存之后都是乱码

发表于 2012-07-28 最后回复 2019-09-26

有谁和我一样一直找不到CSDN的用户空间页面?

发表于 2014-10-09 最后回复 2017-07-02

C结构体、C++结构体 和 C++类的区别

发表于 2012-06-29 最后回复 2017-04-05

PD4ML处理中文的页面怎么处理乱码的问题?

发表于 2012-07-16 最后回复 2016-10-19

java中JTextField怎么设置只能输入一个数字?

发表于 2012-04-08 最后回复 2016-08-14

linux 里面编写c语言用什么软件好用啊?

发表于 2010-04-28 最后回复 2015-06-10

hibernate怎么查询具体一行数据

发表于 2010-05-31 最后回复 2013-07-18

访问自己配置的juddi出现异常

发表于 2013-03-01 最后回复 2013-03-01

安装Joomla!配置mysql数据库时候出错?

发表于 2013-01-06 最后回复 2013-01-06

【【已答复】【腾讯2013校招笔试试题】资源怎么莫名被删掉?求解释!

发表于 2012-12-16 最后回复 2012-12-18

linux里面运行最简单的c程序居然出现这种情况

发表于 2010-04-29 最后回复 2012-11-23

Java中两个模板类对象怎么共享一个容器?

发表于 2012-09-25 最后回复 2012-09-25

java程序访问一个网站次多了就被限制IP了怎么处理?

发表于 2012-08-10 最后回复 2012-08-13

两个很大的数据相加如何实现?

发表于 2012-08-07 最后回复 2012-08-08

下面的两段代码为什么输出不一样??

发表于 2012-08-05 最后回复 2012-08-07

URL相对地址以及绝对地址怎么区分?

发表于 2012-07-28 最后回复 2012-07-28

下面的程序哪有出错了?

发表于 2012-07-25 最后回复 2012-07-25

【已处理】资源不存在为什么还要扣除我们的积分?

发表于 2012-07-14 最后回复 2012-07-16

java创建文件失败

发表于 2012-07-09 最后回复 2012-07-09

怎么求一个给定数组连续区间数之和绝对值最大

发表于 2012-05-12 最后回复 2012-05-13

这个程序哪里有问题??

发表于 2012-05-12 最后回复 2012-05-12

哪里可以下载ANSI C标准库里面函数实现的代码?

发表于 2012-05-11 最后回复 2012-05-11

下面程序哪里有问题

发表于 2012-04-09 最后回复 2012-04-09

C++内存泄漏问题

发表于 2012-03-23 最后回复 2012-03-23

谁有jsp的视屏教程下载网站啊

发表于 2009-12-28 最后回复 2012-02-18

如何得到canvas面板上图片的坐标?

发表于 2011-02-21 最后回复 2011-02-21

Ubuntu中网页各种插件安装命令

发表于 2010-05-01 最后回复 2010-10-10

制作一个24点游戏的算法…………

发表于 2010-07-13 最后回复 2010-07-13

哪里有像javaeye里面的UBB下载啊?

发表于 2010-05-01 最后回复 2010-07-13

懂制作网站的请进

发表于 2010-07-09 最后回复 2010-07-13

是学java有前途还是学c++或者c有前途??

发表于 2010-06-13 最后回复 2010-06-17

考研到底需要报辅导班不?

发表于 2010-06-11 最后回复 2010-06-12

用java制作一个词法分析器?

发表于 2010-06-11 最后回复 2010-06-11

懂hibernate请进【外键出错】…

发表于 2010-05-04 最后回复 2010-05-10

求助下拉式列表框(Select)

发表于 2010-05-08 最后回复 2010-05-08

Hibernate 怎么在查询语句里面进行排序

发表于 2010-05-07 最后回复 2010-05-08

Tomcat常见错误代号

发表于 2009-12-25 最后回复 2010-04-28

java里面的mouseDown时间的用法

发表于 2010-03-15 最后回复 2010-03-15

知道scwcd考试的请进

发表于 2009-12-25 最后回复 2009-12-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除