
发表日期: 2021-03-27 10:22:55 浏览次数:119
桂阳网站制作要多少钱【域名企业邮箱服务器注册申请办理】桂阳网络优化公司哪家好、桂阳软件开发外包价格、桂阳高端企业网站页面制作设计专业公司、桂阳微信公众号小程序购物支付搭建制作公司
桂阳县,隶属于湖南省郴州市,位于郴州市西部,南岭之北麓,舂陵江(湘江支流)的中上流。地理坐标为东经112°13′26″至112°55′46″,北纬25°27′15″至26°13′30″之间。东临北湖区,西与新田、嘉禾相连,北与祁阳、常宁、耒阳、永兴交界,南隔临武,邻近广东,县城距郴州市区31.7公里,总面积2973平方公里。政府驻地:龙潭街道。
桂阳县是历史悠久的千年古郡。自汉初设郡以来,历为郡、国、监、军、路、府、州、直隶州、县的重要地方治所,已有2200多年历史,素有“楚南名区,汉初古郡”之称。 [1-2] 历史文化底蕴深厚,有释道行、释佛乘等佛教高僧,李思聪等文化名人,也有鹿峰庵(寺)等历史悠久的佛教道场,以及筱塘村等中国传统村落。
截至2018年末,桂阳县总人口91.85万人,桂阳县辖22个乡镇(街道)、398个行政村(社区)。 [1-3] 2018年,桂阳县完成生产总值376亿元,财政总收入23.43亿元。 [3]
2020年7月,全国爱卫会决定命名桂阳县为2017-2019周期国家卫生县城。 [4] 2021年1月29日,入选湖南省人民政府公布的2020年度真抓实干成效明显的地区名单。
前面的例子介绍了机器学习如何解决分类问题,它的主要任务是将实例数据划分到合适的分类中。机器学习的另一项任务是回归,它主要用于预测数值型数据。大多数人可能都见过回归的例子——数据拟合曲线:通过给定数据点的最优拟合曲线。分类和回归属于监督学习,之所以称之为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。
与监督学习相对应的是非监督学习,此时数据没有类别信息,也不会给定目标值。在非监督学习中,将数据集合分成由类似的对象组成的多个类的过程被称为聚类;将寻找描述数据统计值的过程称之为密度估计。此外,非监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息。表2 列出了机器学习的主要任务,以及解决相应问题的算法。
表2 用于执行分类、回归、聚类和密度估计的机器学习算法

你可能已经注意到表2 中的很多算法都可以用于解决同样的问题,有心人肯定会问:“为什么解决同一个问题存在四种方法?精通其中一种算法,是否可以处理所有的类似问题?” 下面将回答这些疑问。
从表2 中所列的算法中选择实际可用的算法,必须考虑下面两个问题:一、使用机器学习算法的目的,想要算法完成何种任务,比如,是预测明天下雨的概率还是对投票者按照兴趣分组;二、需要分析或收集的数据是什么。
首先考虑使用机器学习算法的目的。如果想要预测目标变量的值,则可以选择监督学习算法,否则可以选择非监督学习算法。确定选择监督学习算法之后,需要进一步确定目标变量类型,如果目标变量是离散型,如是/否、1/2/3、A/B/C或者红/黄/黑等,则可以选择分类算法;如果目标变量是连续型的数值,如0.0~100.00、-999~999或者+∞~-∞等,则需要选择回归算法。
如果不想预测目标变量的值,则可以选择非监督学习算法。进一步分析是否需要将数据划分为离散的组。如果这是唯一的需求,则使用聚类算法;如果还需要估计数据与每个分组的相似程度,则需要使用密度估计算法。
在大多数情况下,上面给出的选择方法都能帮助读者选择恰当的机器学习算法,但这也并非一成不变。
其次需要考虑的是数据问题。我们应该充分了解数据,对实际数据了解得越充分,越容易创建符合实际需求的应用程序。主要应该了解数据的以下特性:特征值是离散型变量还是连续型变量,特征值中是否存在缺失的值,何种原因造成缺失值,数据中是否存在异常值,某个特征发生的频率如何(是否罕见得如同海底捞针),等等。充分了解上面提到的这些数据特性可以缩短选择机器学习算法的时间。
我们只能在一定程度上缩小算法的选择范围,一般并不存在最好的算法或者可以给出最好结果的算法,同时还要尝试不同算法的执行效果。对于所选的每种算法,都可以使用其他的机器学习技术来改进性能。在处理输入数据之后,两个算法的相对性能也可能会发生变化。后续我们将进一步讨论此类问题,一般说来发现最好算法的关键环节是反复试错的迭代过程。
机器学习算法虽然各不相同,但是使用算法创建应用程序的步骤却基本类似,下面会介绍如何使用机器学习算法的通用步骤。
学习和使用机器学习算法开发应用程序,通常遵循以下的步骤。
1. 收集数据。我们可以使用很多方法收集样本数据,如:制作网络爬虫从网站上抽取数据、从RSS反馈或者API中得到信息、设备发送过来的实测数据(风速、血糖等)。提取数据的方法非常多,为了节省时间与精力,可以使用公开可用的数据源。
2. 准备输入数据。得到数据之后,还必须确保数据格式符合要求。此外,还需要为机器学习算法准备特定的数据格式,如某些算法要求特征值使用特定的格式,一些算法要求目标变量和特征值是字符串类型,而另一些算法则可能要求是整数类型。与收集数据的格式相比,处理特殊算法要求的格式相对简单得多。
3. 分析输入数据。此步骤主要是人工分析以前得到的数据。为了确保前两步有效,最简单的方法是用文本编辑器打开数据文件,查看得到的数据是否为空值。此外,还可以进一步浏览数据,分析是否可以识别出模式;数据中是否存在明显的异常值,如某些数据点与数据集中的其他值存在明显的差异。通过一维、二维或三维图形展示数据也是不错的方法,然而大多数时候我们得到数据的特征值都不会低于三个,无法一次图形化展示所有特征。
这一步的主要作用是确保数据集中没有垃圾数据。如果是在产品化系统中使用机器学习算法并且算法可以处理系统产生的数据格式,或者我们信任数据来源,可以直接跳过第3步。此步骤需要人工干预,如果在自动化系统中还需要人工干预,显然就降低了系统的价值。
4. 训练算法。机器学习算法从这一步才真正开始学习。根据算法的不同,第4步和第5步是机器学习算法的核心。我们将前两步得到的格式化数据输入到算法,从中抽取知识或信息。这里得到的知识需要存储为计算机可以处理的格式,方便后续步骤使用。
如果使用非监督学习算法,由于不存在目标变量值,故而也不需要训练算法,所有与算法相关的内容都集中在第5步。
5. 测试算法。这一步将实际使用第4步机器学习得到的知识信息。为了评估算法,必须测试算法工作的效果。对于监督学习,必须已知用于评估算法的目标变量值;对于非监督学习,也必须用其他的评测手段来检验算法的成功率。无论哪种情形,如果不满意算法的输出结果,则可以回到第4步,改正并加以测试。问题常常会跟数据的收集和准备有关,这时你就必须跳回第1步重新开始。
6. 使用算法。将机器学习算法转换为应用程序,执行实际任务,以检验上述步骤是否可以在实际环境中正常工作。此时如果碰到新的数据问题,同样需要重复执行上述的步骤。

《机器学习实战》通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释机器学习的核心算法,读者可以将算法运用于一些策略性任务中,如分类、预测、推荐。还可用它们来实现一些更高级的功能,如汇总和简化等。
桂阳网站制作要多少钱【域名企业邮箱服务器注册申请办理】桂阳网络优化公司哪家好、桂阳软件开发外包价格、桂阳高端企业网站页面制作设计专业公司、桂阳微信公众号小程序购物支付搭建制作公司
服务热线
顶部
备案号: 苏ICP备11067224号
CopyRight © 2011 书生商友信息科技 All Right Reserved
24小时服务热线:400-111-6878 E-MAIL:1120768800@qq.com QQ:1120768800
网址: http://www.768800.com 网站建设:上往建站
关键词: 网站建设| 域名邮箱| 服务器空间| 网站推广| 上往建站| 网站制作| 网站设计| 域名注册| 网络营销| 网站维护|
企业邮箱| 虚拟主机| 网络建站| 网站服务| 网页设计| 网店美工设计| 网站定制| 企业建站| 网站设计制作| 网页制作公司|
400电话办理| 书生商友软件| 葬花网| 调温纤维| 海洋馆运营维护| 北京保安公司| 殡仪馆服务| 殡葬服务| 苏州殡葬一条龙| 朝阳殡葬| 苏州殡葬服务|
欢迎您免费咨询,请填写以下信息,我们收到后会尽快与您联系
服务热线:400-111-6878