mapreduce中怎么实现K-M类聚-快上网网站建设公司

mapreduce中怎么实现K-M类聚

mapreduce中怎么实现K-M类聚，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

从网站建设到定制行业解决方案，为提供网站制作、成都网站制作服务体系，各种行业企业客户提供网站建设解决方案，助力业务快速发展。成都创新互联将不断加快创新步伐，提供优质的建站服务。

首先是map

public static class KMmap extends Mapper{
        //中心集合
        //这里的聚簇集合是自己设定的    centersPath就是集合在hdfs中存放的路径
        ArrayList> centers = null;
        //用k个中心
        int k = 0;
        //读取中心
        protected void setup(Context context)throws IOException, InterruptedException {
            //getCentersFromHDFS方法就是传入一个Path，得到一个ArrayList>集合
             centers = Utils.getCentersFromHDFS(context.getConfiguration().get("centersPath"),false);
             k = centers.size();
        }
         /**
          * 1.每次读取一条要分类的条记录与中心做对比，归类到对应的中心
          * 2.以中心ID为key，中心包含的记录为value输出(例如： 1 0.2 。  1为聚类中心的ID，0.2为靠近聚类中心的某个值)
          */
        @Override
        protected void map(LongWritable key, Text value,Context context)
                throws IOException, InterruptedException {
            ArrayList fileds = Utils.textToArray(value);
            //textToArray方法将map进来的一行value根据“,”分割后转化为ArrayList的集合
            int sizeOfFileds = fileds.size();
            double minDistance = 99999999;
            int centerIndex = 0;
            //依次取出k个中心点与当前读取的记录做计算
            for(int i=0;ireduce
    //利用reduce的归并功能以中心为Key将记录归并到一起
    public static class KMreduce extends Reducer{

          /**
            * 1.Key为聚类中心的ID value为该中心的记录集合
            * 2.计数所有记录元素的平均值，求出新的中心
            */
        
        protected void reduce(IntWritable key, Iterable values,
    Context context)throws IOException, InterruptedException {
             ArrayList> filedsList = new ArrayList>();
            //依次读取记录集，每行为一个ArrayList
             for(Iterator it = values.iterator();it.hasNext();){
                 ArrayList tempList = Utils.textToArray(it.next());
                 filedsList.add(tempList);
             }
             //计算新的中心
             //每行的元素个数
             int filedSize = filedsList.get(0).size();
             double[] avg = new double[filedSize];
             for(int i=0;i最后是其中所用到的util类，主要是提供一些读取文件和操作字符串的方法
public class Utils {
    
    //读取中心文件的数据
    public static ArrayList> getCentersFromHDFS(String centersPath,boolean isDirectory)
                    throws IOException{
        ArrayList> result = new ArrayList>();
        Path path = new Path(centersPath);
        Configuration conf = new Configuration();
                  
        FileSystem fileSystem = path.getFileSystem(conf);
        
        if(isDirectory){    
            FileStatus[] listFile = fileSystem.listStatus(path);
            for (int i = 0; i < listFile.length; i++) {
                result.addAll(getCentersFromHDFS(listFile[i].getPath().toString(),false));
                }
            return result;
        }
        FSDataInputStream fsis = fileSystem.open(path);
        LineReader lineReader = new LineReader(fsis, conf);
        Text line = new Text();
          while(lineReader.readLine(line) > 0){
                      ArrayList tempList = textToArray(line);
                          result.add(tempList);
                      }
                      lineReader.close();
            return result;
    }
    
    //删掉文件
     public static void deletePath(String pathStr) throws IOException{
                Configuration conf = new Configuration();
                Path path = new Path(pathStr);
                FileSystem hdfs = path.getFileSystem(conf);
                hdfs.delete(path ,true);
              }
     
     
     public static ArrayList textToArray(Text text){
          ArrayList list = new ArrayList();
          String[] fileds = text.toString().split("\t");
          for(int i=0;i> oldCenters = Utils.getCentersFromHDFS(centerPath,false);
                  List> newCenters = Utils.getCentersFromHDFS(newPath,true);
                  
                    int size = oldCenters.size();
                    int fildSize = oldCenters.get(0).size();
                    double distance = 0;
                    for(int i=0;i关于mapreduce中怎么实现K-M类聚问题的解答就分享到这里了，希望以上内容可以对大家有一定的帮助，如果你还有很多疑惑没有解开，可以关注创新互联行业资讯频道了解更多相关知识。            
            
                        

            分享标题：mapreduce中怎么实现K-M类聚            

            当前链接：http://cdkjz.cn/article/jpegdj.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

mapreduce中怎么实现K-M类聚

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

mapreduce中怎么实现K-M类聚

相关资讯

如何备案中文域名,如何注册中文域名网站

网站模板下载之后如何修改

网页设计如何制作网站视频,DW网页设计制作网站

新手怎么开传媒公司,自媒体平台注册

手机微信如何建公众号,一个手机如何注册第二个微信

如何买香港服务器空间，通过什么渠道可以购买香港服务器

ip绑定多域名,ssl证书绑定域名还是ip

阿里云服务器ECS首购1折起额外享续费/升级/新购

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接