串行聚类算法

[导读]这一类算法比较简单。我们考虑一下规则。* 在算法中所有特征向量只呈现一次；* 实际聚类成几类我们事先不知道；（在算法执行过程中，新的类被创建）我们给出如下记号，d(x,C) 表示特征向量x与C类之间

这一类算法比较简单。我们考虑一下规则。

* 在算法中所有特征向量只呈现一次；

* 实际聚类成几类我们事先不知道；（在算法执行过程中，新的类被创建）

我们给出如下记号，d(x,C) 表示特征向量x与C类之间的不相似度（dissimilarity）,我们不考虑它的具体定义，大家可以根据自己的实际情况人为选择。

需要人为定义两个参数：一个阈值，一个是最大类别数。

基本思想是：被考虑的每一个向量，根据它与现存的类之间的不相似度，它要么被分到某个已经创建的类，要么被放到重新创建的一个新类。

设m是目前为止，已经创建的类的个数。看如下算法：

threshold 和maxclass表示的两个预先给定的参数。

m = 1;
C_m = {x_1};
for i = 2 to N
  find C_k : d(x_i, C_k) = min(1<=j threshold) AND (m<maxclass) then
    m = m+1;
    C_m = {x_i};
  else
    C_k = C_k U {x_i};
  end if
end for

大家根据自己的需要来设计自己的d(x_i, C_j)的定义。

这种方法叫做 BSAS （Basic Sequential Algorithm Scheme）

评价：Sergios 的评价，我稍作理解

* 如果使用similarity表示近邻测度，只需要改下阈值，以及min改成max就行了。

* 如果我们用类代表的方式给出近邻测度的话，BSAS方法比较适合Compact类型的类，如果有证据表明，某些类不是compact类型的，这个方法就不好了。

* 时间复杂度为O（N），与特征向量的个数一致

这个方法有一些变种的应用，详细参开《Pattern Recognition》

阿维塔、赛力斯已入股！华为引望可能成“中国博世”

Trianz与AWS达成战略合作协议，彻底改变云采用和管理方式

人工智能驱动工具SODA V将颠覆汽车市场，使汽车开发时间和成本降低90%

从容应对未知风险----解密亚马逊云科技的韧性之道

中国游戏市场开始复苏！腾讯、网易等巨头缩减在日本投资

独立自主！华为董事：致力打造不依赖西方的技术

华为张平安：数字世界话语权最终由生态繁荣决定！

中国通信服务公布2024年中期业绩

NVI技术创新联盟成立！自主生态将带动产业链高速发展

软通动力与长三角投资达成战略合作共谋数字生态新发展

海南区6家凯悦系酒店与岚图达成战略合作，共同推动新能源出行体验

安岚携手妮可•巴菲特开启疗愈之旅在秋日红叶的浪漫中疗愈身心

不惧美国封锁！华为：我们给大家提供系统、存储等

尼尔森IQ深耕中国四十载，共绘未来新篇章

第二十二届跨盈年度B2B营销高管峰会2025聚焦"营销竞取，打破市场内卷实现认知进化"

恒久动力驰骋天地美孚1号携手周冠宇邀您纵擎驰骋，劲享驾趣体验

美通社母公司Cision发布CisionOne平台，进军亚太地区媒体监测市场

移远通信推出大模型解决方案，重塑千行百业智能边界

高途公布2024年第二季度未经审计业绩

华为发布AI百校计划：培养AI人才每年获最高100万支持