数据挖掘技术



数据挖掘技术。

1 什么是数据挖掘?

呵呵,虽然是理论上的一些笔记但可以好好看看(建议!!!)

数据挖掘在大型数据存储库中,自动地发现有用信息的过程。我的理解就是:从中找到利于你感兴趣的主题,如果你是一个销售人员,当然你会毫不犹豫去提高你的销售量,但怎么去提高呢,假设你手中有很多很多的图表,统计数据,你该怎么做呢?这时你可以想想你感兴趣的主题或许就在这些数据里吧,对,确实,你是个聪明人,那你会怎么做呢?呵呵,数据挖掘或许会帮你找到其中数据之间的关联,结合你自己的工作经验,分析分析一下,或许你会得出结论-这就是简单的一个例子。你有了一个简单的想法了吧,继续我们的主题->呵[......]

Read more

数据挖掘的任务



数据挖掘的任务

通常数据挖掘的任务分为两大类:

1 预测任务这些任务的目标是根据其他属性的值,预测特定属性的值(例如知道这一季度的房产销售情况去简单预测下一个季度的房产销售情况的,当然这需要大量的统计数据和具体的市场变化情况考虑在内,同时这证明了数据挖掘是一个交叉学科)

2 描述任务.其目标是导慨括数据中潜在联系的模式(相关,趋势,聚类,轨迹,和异常)这些术语慢慢在我后续的学习中会为你一一揭秘描述性数据挖掘任务通常是探查性的,并且需要后处理技术验证和解释结果

具体一个实例:

预测建模->关联分析->聚类分析->异常检测

本文链接地址: 数据挖掘的任[......]

Read more

数据挖掘介绍

继续数据挖掘

预测建模(predictive modeling):

涉及以说明变量函数的方式为目标变量建立模型,你可以想想数据的种类,一类是离散的吧(预测一个犹豫于Amazon购书还是JD购书的买者会在哪一家书店买呢?),另一类是连续的吧(预测某股票的未来价格),所以用于预测离散的目标变量是分类(classification),而用于预测连续的目标变量则是回归(regression)两项任务的基本目标都是训练一个模型,使目标变量预测值与实际值的误差达到最小,呵呵,这是每个理性人的想法了

关联分析(association analysis):

用来发现描述数据中强关联特征[......]

Read more

数据挖掘考试重点(条理版)

数据挖掘考试重点(条理版)

填空或简答:

1. 数据、信息和知识是广义数据表现的不同形式。

2. 主要知识模式类型有:广义知识,关联知识,类知识,预测型知识,特异型知识

3. web挖掘研究的主要流派有:Web结构挖掘、Web使用挖掘、Web内容挖掘

4. 一般地说,KDD是一个多步骤的处理过程,一般分为问题定义、数据抽取、数据预处理、.数据挖掘以及模式评估等基本阶段。

5. 数据库中的知识发现处理过程模型有:阶梯处理过程模型,螺旋处理过程模型,以用户为中心的处理结构模型,联机KDD模型,支持多数据源多知识模式的KDD处理模型

6. 粗略地说,知识发现[......]

Read more

数据挖掘之-简单属性之间的相似度和相异度

数据挖掘之-简单属性之间的相似度和相异度。通常,具有若干属性的对象之间的邻近度用单个属性的邻近度的组合来定义。

首先了解什么是标称属性:

标称意味“与名称相关”。标称属性(nominal attribute)的值是一些符号或事物的名称。每个值代表某种类别、编码或状态,因此标称属性又被看做是分类的(categorical)。这些值不必具有有意义的序。在计算机科学中,这些值也被看做是枚举的(enumeration)。

例2.1 标称属性。假设hair_color(头发颜色)和marital_status(婚姻状况)是两个描述人的属性。在我们的应用中,hair_color的可能值为[......]

Read more

java数据挖掘-K-means算法

数据挖掘-K-means算法

K-means算法是一种基于样本间相似性度量的间接聚类方法。
此算法以K为参数,把N个对象分为K个簇,以使簇内具有较高的相似度,而且簇间的相似度较低。相似度的计算根据一个簇中对象的平均值来进行。
此算法的工作过程为:首先从N个数据对象任意选择K个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。
一般都采用均方差作为标准测度函数.K个聚类具有以下特点:各聚类[......]

Read more

JSP技术生成动态页面内容的过程图示

JSP技术生成动态页面内容的过程

JSP技术生成动态页面内容的过程

Jsp页面在用户第一次访问请求时会被编译成Servlet文件,然后由这个Servlet来处理用户的请求,它会首先执行其中的程序片段和jsp标记中的操作,然后将执行结果以html的形式返回

JSP工作原理

JSP工作原理

一个JSP文件的执行过程可以分为以下几个步骤:

1 .浏览器客户端向将JSP引擎发出对JSP页面的请求

2 .JSP引擎将对应的JSP页面转化成Java Servlet源代码

3 .JSP引擎编译源代码生成.class文件

4 .JSP引擎加载运行对应的.class文件生成响应的结果页面

5 .JSP引擎吧响应的输出结果发送到浏览器端

JSP引擎管理JSP页面生命周期的两个阶段:转化阶段(Translation Phase)和执行阶段(Execution Phase)

1 每当一个对JSP页面的请求到来时,JSP引擎检验JSP页面[......]

Read more

strut2入门实例Action配置等笔记

strut2入门实例Action配置等笔记。

我们来编写一个基于Struts2的Web程序。这个程序的功能是让用户录入两个整数,并提交给一个Struts Action,并计算这两个数的代数和,如果代码和为非负数,则跳转到positive.jsp页面,否则跳转到negative.jsp页面。
【第1步】 安装Struts2
这一步对于Struts1.x和Struts2都是必须的,只是安装的方法不同。Struts1的入口点是一个Servlet,而Struts2的入口点是一个过滤器(Filter)。因此,Struts2要按过滤器的方式配置。下面是在web.xml中配置Struts2的代码:[......]

Read more

Struts2工作原理

Struts2工作原理

Struts2请求响应流程:

在struts2的应用中,从用户请求到服务器返回相应响应给用户端的过程中,包含了许多组件如:Controller、ActionProxy、ActionMapping、Configuration Manager、ActionInvocation、Inerceptor、Action、Result等。下面我们来具体看看这些组件有什么联系,它们之间是怎样在一起工作的。
(1) 客户端(Client)向Action发用一个请求(Request)
(2) Container通过web.xml映射请求,并获得控制器(Controller)的名[......]

Read more