当前位置:首页 > 公众号精选 > AI科技大本营
[导读]作者|俊欣来源| 关于数据分析与可视化我们平常都会使用很多的社交媒体,有微信、微博、抖音等等,例如在微博上面,我们会关注某些KOL,同时自己身边的亲朋好友等等也会来关注我们自己,成为我们自己的粉丝。而慢慢地随着粉丝的量不断累积,这层关系网络也会不断地壮大,很多信息也是通过这样的关...

作者 | 俊欣
来源 | 关于数据分析与可视化我们平常都会使用很多的社交媒体,有微信、微博、抖音等等,例如在微博上面,我们会关注某些KOL,同时自己身边的亲朋好友等等也会来关注我们自己,成为我们自己的粉丝。而慢慢地随着粉丝的量不断累积,这层关系网络也会不断地壮大,很多信息也是通过这样的关系网络不断地向外传播,分析这些社交网络并且了解透彻它对于我们做出各项商业决策来说也是至关重要的,今天小编就用一些Python的第三方库来进行社交网络的可视化

数据来源

小编用的数据是来自领英当中的社交数据,由于小编之前也在美国读书,也尝试过在国外找实习、找工作等等,都是通过领英在进行职场上的社交,投递简历、结交职场精英等等,久而久之也逐渐地形成了自己的社交网络,我们将这部分的社交数据下载下来,然后用pandas模块读取

数据的读取和清洗

当然我们先导入需要用到的模块import pandas as pd
import janitor
import datetime

from IPython.core.display import display, HTML
from pyvis import network as net
import networkx as nx
读取所需要用到的数据集df_ori = pd.read_csv("Connections.csv", skiprows=3)
df_ori.head()
接下来我们进行数据的清洗,具体的思路就是将空值去除掉,并且数据集当中的“Connected on”这一列,内容是日期,但是数据类型却是字符串,因此我们也需要将其变成日期格式。df = (
df_ori
.clean_names() # 去除掉字符串中的空格以及大写变成小写
.drop(columns=['first_name', 'last_name', 'email_address']) # 去除掉这三列
.dropna(subset=['company', 'position']) # 去除掉company和position这两列当中的空值
.to_datetime('connected_on', format='%d %b %Y')
)
output company            position connected_on
0                xxxxxxxxxx  Talent Acquisition   2021-08-15
1               xxxxxxxxxxxx   Associate Partner   2021-08-14
2                      xxxxx                猎头顾问   2021-08-14
3  xxxxxxxxxxxxxxxxxxxxxxxxx          Consultant   2021-07-26
4    xxxxxxxxxxxxxxxxxxxxxx     Account Manager   2021-07-19

数据的分析与可视化

先来看一下小编认识的这些人脉中,分别都是在哪些公司工作的df['company'].value_counts().head(10).plot(kind="barh").invert_yaxis()
output从上图可以看到,排在比较前面的大公司都是亚马逊、谷歌、Facebook、微软以及JP Morgan等大公司,看来在小编的校友以及人脉当中也就属小编混的最差了然后我们再来看一下小编所结交的人脉中,大多都是什么职业的df['position'].value_counts().head(10).plot(kind="barh").invert_yaxis()
output从上图可以看出,大多都是从事的是软件工程师相关的工作,排在第二的则是数据科学家以及高级软件工程师,看来程序员认识的果然大多也都是程序员。然后我们来看一下社交网络的可视化图表的绘制,但是在这之前呢,小编需要先说明几个术语,每一个社交网络都包含:
  • 节点:社交网络当中的每个参与者
  • 边缘:代表着每一个参与者的关系以及关系的紧密程度
我们先来简单的绘制一个社交网络,主要用到的是networkx模块以及pyvis模块,g = nx.Graph()
g.add_node(0, label = "root") # intialize yourself as central node
g.add_node(1, label = "Company 1", size=10, title="info1")
g.add_node(2, label = "Company 2", size=40, title="info2")
g.add_node(3, label = "Company 3", size=60, title="info3")
我们先是建立了4个节点,也分别给他们命名,其中的参数size代表着节点的大小,然后我们将这些个节点相连接g.add_edge(0, 1)
g.add_edge(0, 2)
g.add_edge(0, 3)
最后出来的样子如下图我们先从小编的人脉中,他们所属的公司来进行网络的可视化,首先我们对所属的公司做一个统计排序df_company = df['company'].value_counts().reset_index()
df_company.columns = ['company', 'count']
df_company = df_company.sort_values(by="count", ascending=False)
df_company.head(10)
output company  count
0                            Amazon     xx
1                            Google     xx
2                          Facebook     xx
3   Stevens Institute of Technology     xx
4                         Microsoft     xx
5              JPMorgan Chase 
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

据CNMO了解,有韩媒报道称,韩国将在下个月公布下一代网络战略,为6G移动通信的商业化做准备。据悉,战略中除了6G网络的智能化、融合和空间扩展的技术战略外,还将提出公私合营的合作方式。

关键字: 6G 网络 战略

前不久,一位意大利女航天员在网络上走红,因为她在海外社交平台上发布了一组太空摄影作品,并配上了中国著名书法家王羲之所著《兰亭集序》中一句描绘宇宙景观的古文。“仰观宇宙之大,俯察品类之盛,所以游目骋怀,足以极视...

关键字: 卫星 航天器 网络 MIDDOT

这两年来Wi-Fi 6无线网络得到了大家的认可,现在的手机及路由器几乎都支持了这一标准,速度超过家里的千兆带宽没问题,在下一代的无线就是Wi-Fi 7了,高通日前首次演示了Wi-Fi 7的实际速度,达到了5Gbps。

关键字: 5G 网络 高通Wi-Fi 7

工厂运用创新的工业4.0技术和循环经济能力,加速可持续的先进制造实践 上海2022年10月17日 /美通社/ -- 近日,伟创力宣布其位于巴西索罗卡巴(Sorocaba)的工厂已获准加入世界经济论坛全球灯塔网络(GLN...

关键字: 伟创力 网络 工业4.0 可持续发展

量子网络是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。当某个装置处理和计算的是量子信息,运行的是量子算法时,它就是量子网络。量子网络的概念源于对可逆计算机的研究。研究可逆计算机的目的是为了解...

关键字: 欧洲 量子计算机 网络

北京2022年10月14日 /美通社/ -- 近年来,WiFi技术在医疗场景中得到广泛应用,无论是无线查房、无线护理、无线输液,还是医护人员定位管理、特殊患者定位看护、婴儿防盗等医疗服务,无线网络都承担至关重要的角色。近...

关键字: 网络 联网 智慧医疗 智慧医院

北京2022年10月14日 /美通社/ -- 2022年10月14日,亚马逊云科技举办一年一度的中国合作伙伴峰会。本届峰会以"价值成就 探索无限"为主题,面向合作伙伴推出"3+3价值成就体系...

关键字: 亚马逊 网络 AC MARKET

北京——2022年10月14日,亚马逊云科技举办一年一度的中国合作伙伴峰会。本届峰会以“价值成就 探索无限”为主题,面向合作伙伴推出“3+3价值成就体系”,将通过核心能力建设、深度行业赋能和全域覆盖三大有力举措,以及技术...

关键字: 亚马逊云科技 网络

北京2022年10月11日 /美通社/ -- 在四川大凉山深处,有一只"凉山黑鹰"少年篮球队:队员平均年龄12岁,平均身高1米3,球队刚成立时,连个像样的球场都没有。然而,凭着一腔热情和惊人天赋,这只...

关键字: 网络 BSP 内核 腾讯

据中国铁道建筑报消息,由中铁十四局承建的上海机场联络线2标单月推进288环,进尺达到576米,平均日进尺19.2米,创造了全预制大直径泥水盾构国内最快纪录。据了解,上海机场联络线是上海市首条市域铁路,正线全长68.6公里...

关键字: 铁路 网络 控制工程

AI科技大本营

111 篇文章

关注

发布文章

编辑精选

技术子站

关闭