鹤岗| 郯城| 额济纳旗| 方山| 长沙县| 成武| 明水| 洛阳| w88优德中文 万博app苹果版下载 江津| 大发dafabet888 涞源| 天祝| 襄城| 大发dafa888 南海镇| 库尔勒| 龙胜| BR88app.COM官网 贵州| 宾县| 大奖娱乐城 磁县| 万博manbetx体育 dafa888官网 绥宁| 优德w88 桑植| 下陆| 耒阳| 余干| dafabet手机版登 w88 罗城| 安新| 尚义| manbetx 荥阳| 杭锦旗| 溧阳| 沐川| 汝南| 茄子河| manbetx官网 新河| 永平| br88冠亚 betway必威 宜君| 峡江| 白朗| 都兰| 红原| 新万博体育登录网址 双牌| 大发888bet 金昌| 茂县| 大奖888 庐江| 1xbet吧 manbetx客户端 麟游| 武功| 株洲县| 绥宁| 九州娱乐官方网站 安福| 康平| 大发dafa888 manbetx网页 阳高| 寿宁| 南山| 大发dafa888 淮阳| 涿鹿| 九寨沟| 万博mambetx官网 manbetx 友好| 新泰| 巴东| 白朗| BR88官网 dafabet手机版中文 调兵山| 特克斯| 神池| 萝北| 新县| 郁南| 淳化| 铁岭县| 奉化| 让胡路| 绥宁| 3344111 鼎湖| 盱眙| 永仁| 丹棱| 额尔古纳| 晋城| 张湾镇| 博湖| 冠亚娱乐 大方| w88手机娱乐 花都| wanbetx万博体育 古田| 永安| 南岔| 冠亚彩票 二连浩特| 会理| 牟定| manbetx2018官网 延川| 绥阳| 新万博体育登录网址 盈江| 汶川| 维西| 华池| Lovebet BR88 务川| 大奖88 德清| 祁连| 石林| 浪卡子| betway必威 烟台| 拉萨| 伊川| 万博官网manbetx 克拉玛依| yzc888亚洲城手机版 平山| 优德88 雷山| 亚洲城网页版网址多少 阿坝| 江城| 南宁| 都江堰| 3344111 临沧| 巴林左旗| 南浔| 冠亚彩票 南海镇| 峨眉山| weide 南澳| 卓尼| 松桃| 台州| 罗定| 耒阳| 狗万体育官网 manbetx娱乐 乌审旗| 桓仁| 3344666 万荣| 上高| dafabet娱乐城 同心| 弓长岭| ca888亚洲城唯一官方 忠县| wofacaidafa888 新津| 宁都| 岱岳| 清苑| 博鳌| 柯坪| betway必威 民和| 万博manbet官网 betway必威 br88 赣州| 霍邱| 九龙坡| 灵丘| 阿城| manbetx 滦县| 济南| 大发客户端下载 含山| 堆龙德庆| dafa888.com 铁山| 冠亚br88 万博manbetx 3344555 合江| 潮安| 沾化| 优德88 ca88亚洲城娱乐手机版 长垣| 临汾| 潘集| 同德| 澧县| 冠亚娱乐 西昌| 博管理 平原| BR88 3344111.com 宁化| 旺苍| 大奖88 3344666.com 师宗| dafabet网页版 梅州| 临汾| 盘县| 上饶市| 嘉黎| fun888 黔江| betway88 正阳| 二道江| 宝兴| 洛隆| 永城| 深泽| wanbetx客户端 bv伟德体育 大发888bet 万博manbetx体育 manbetx体育 ca88亚洲城官方网站 长垣| br88 敦煌| 西宁| 筠连| 富锦| 岢岚| 黄陂| fun88 交口| 江门| 阜城| 普兰店| 高唐| bifacom88 黄石| wofacai888手机版 manbetx登录 虞城| dafabet手机版登陆 黄山市| 吉安市| 景泰| 永寿| 汾西| 三穗| dafabet 白碱滩| 新万博 fun88 鹤岗| 武宣| 十堰| 巴中| 万博体育1.0 永州| 冠亚pt 麦积| wanbetx万博体育 手机寰宇浏览器官网 3344111.com 亚洲城网页版网址多少 双鸭山| 巨野| betway必威 乐天堂娱乐 manbetx体育 大奖彩票 张北| 中山| dafa888 互助| manbetx官方 东莞|

许晋亨想跟儿子一起庆祝结婚十周年,李嘉欣生气:为什么要邀请他

2019-02-20 13:51 来源:北京热线010

  许晋亨想跟儿子一起庆祝结婚十周年,李嘉欣生气:为什么要邀请他

  万博app 下载令人遗憾的是,不文明行为把自我凌驾于社会之上;但值得欣慰的是,每一次关于事件的深入讨论,都是一次道德教育的过程,也是自我反思的良机。这样一来,升发动机自然成为了经济实惠的首选黄金排量。

在三亚美丽乡村建设的重要站点之一——中廖村,精彩的节目、美丽的风景让佳丽们陶醉其中,不少佳丽拿出了相机拍下这美好的一幕。中国将继续把东盟作为周边外交优先方向,以此次中国—东盟自贸协定“升级版”全面生效为契机,同包括东盟成员在内的地区国家一道,进一步推动区域内贸易投资自由化便利化,推动东亚地区经济一体化进程,与东盟携手打造更高水平的战略合作关系,构建更为紧密的中国东盟命运共同体,使中国—东盟合作继续成为促进地区和平与繁荣的重要支柱。

  规模大最具代表性全球媒体盛会2014年,11个国家、47家媒体机构参加论坛;2015年,60多个国家和国际组织、近140家主流媒体参加论坛;2016年,101个国家、212家外国媒体参加论坛;2017年,126个国家和国际组织、265家外国媒体参加论坛;2018年,来自90个国家和国际组织、205家媒体和机构的256位嘉宾汇聚海南博鳌参加论坛。柬埔寨政府发言人帕西潘评价道,这一愿景是双方在未来打造命运共同体的具体路线图,也是双方对建立地区持久和平与稳定、实现共同发展和分享发展成果的承诺。

    创新:一警多能,全警动员  2017年9月18日,张兆腾调任三亚市公安局局长。对此,有建议说,博物馆必须在和公众沟通上寻找更好的方式,要彻底俘获参观者的心,应该说大家听得懂的“人话”,打通古今之间的界限,让当下的生活与文物、展览发生紧密的联系,增加趣味性、平易性,又不失深度、广度和厚度,如此才能让人们建立和坚定真正的文化自信。

原标题:我省开展今冬明春防灾减灾安全生产专项行动  根据省政府办公厅近日印发的《海南省今冬明春防灾减灾安全生产专项行动工作方案》,省政府决定于2018年11月至2019年3月,在全省范围内开展为期5个月的今冬明春防灾减灾安全生产专项行动。

  中国将继续把东盟作为周边外交优先方向,以此次中国—东盟自贸协定“升级版”全面生效为契机,同包括东盟成员在内的地区国家一道,进一步推动区域内贸易投资自由化便利化,推动东亚地区经济一体化进程,与东盟携手打造更高水平的战略合作关系,构建更为紧密的中国东盟命运共同体,使中国—东盟合作继续成为促进地区和平与繁荣的重要支柱。

  这说明,皮质醇水平高的人记忆力更差、大脑体积更小。  人民网重庆11月16日电(王嫚黄亚辉)神女应无恙,当惊世界殊,层林尽染,霞光夺目的红叶已经“悄悄”铺满重庆巫山。

  此外,从2015年起,刘学国以记账方式在多军所管理的加油站多次加油,累计消费金额1万余元。

    “如今,不用出门就挣钱,在家还能照顾妻子。今天我们要讲述的是两名大学生,因宣扬邪教“法轮功”被判刑的真实案件。

  由此,可有效降低自然和人为因素造成的损失。

  dafabet属于什么游戏同时,竞争规则在国际经贸规则体系中的地位日益重要,竞争政策和反垄断执法也越来越成为自贸协定的重要议题。

  (胡虹潘珍净)(责编:胡虹、张祎)所以所在地气温较低的车主可以更换冰点更低的冷却液,以我的经验,一定要低于所在地区最低气温20摄氏度左右,才更安全。

  br88冠亚 冠亚娱乐 亚洲城官网下载

  许晋亨想跟儿子一起庆祝结婚十周年,李嘉欣生气:为什么要邀请他

 
责编:
炼数成金 大数据 Python 查看内容

许晋亨想跟儿子一起庆祝结婚十周年,李嘉欣生气:为什么要邀请他

dafa888   人民网重庆11月16日电(王嫚黄亚辉)神女应无恙,当惊世界殊,层林尽染,霞光夺目的红叶已经“悄悄”铺满重庆巫山。

2018-9-27 09:57| 发布者: 炼数成金_小数| 查看: 26037| 评论: 0|原作者: 丁彦军|来自: Python中文社区

摘要: 中秋佳节,除了假日团圆,月饼也是头巷尾的话题焦点今年中秋,谁的月饼呼声最高?什么口味的月饼虽受欢迎?我将与你一起爬取淘宝网全网月饼销售数据,再经过数据分析,告诉你今年谁是“月饼之王”。不过在爬取数据与 ...

tm Python 工具 Hadoop 数据分析

中秋佳节,除了假日团圆,月饼也是头巷尾的话题焦点今年中秋,谁的月饼呼声较高?什么口味的月饼虽受欢迎?

我将与你一起爬取淘宝网全网月饼销售数据,再经过数据分析,告诉你今年谁是“月饼之王”。不过在爬取数据与分析数据之前,插播一段月饼历史之情。

一、月饼的历史
据说早在殷周时期,江浙一带就有一种纪念太师闻仲的边薄心厚的“太师饼”,可以说是月饼的祖宗了。至于为什么要纪念闻仲,我也不知道。


后来到了北宋,被皇家看上了,在中秋节那天吃,不得不说皇室贵族的宣传力度果然是一般人的十倍以上,为月饼的传播起了跨世纪的作用。
贵族们一看这玩意火了,得蹭个热点,那给它们取个名字吧,于是想了个大名叫“月团”,小名叫“小饼”,我说你们为啥就不能把这两个名字合并一下?

至于月饼这个名字,是直到南宋时期才第一次出现在书里的。后面大概就是月饼一步一步凭借自己的努力渐渐站在中秋节身边的励志故事了。
众所周知:传统的中国四大月饼包括,广式月饼,京式月饼,苏式月饼和潮式月饼。现在随着时代的发展,也出现了好多新种类,比如冰皮月饼、海味月饼、冰淇淋月饼等等。

二、数据获取
我就以淘宝网上的月饼为目标,来获取最近全国各地近段时间月饼销售情况。(目标链接:https://s.taobao.com/search?q=月饼)


工具&模块:
工具:Python3.7+Sublime Text
模块:requests、jieba、matplotlib、wordcloud、imread、pandas、numpy 等。
目的主要是通过对数据的分析,来看看不同关键词word对应的sales的统计、月饼价格以及销量的分布情况、以及不同省份的月饼销量情况。
详情代码如下:
import requests
import re

#下载网页
def get_html_text(url):
    try:
        res = requests.get(url,timeout=30)
        res.raise_for_status()
        res.encoding = res.apparent_encoding
        return res.text
    except:
        return ""

#解析网页并保存数据    
def parse_page(html):
    try:
        plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html) 
        tlt = re.findall(r'\"raw_title\"\:\".*?\"', html)
        loc = re.findall(r'\"item_loc\"\:\".*?\"', html)
        sale = re.findall(r'\"view_sales\"\:\".*?\"', html)
        #print(plt)
        for i in range(len(plt)):
        price = eval(plt[i].split(':')[1])
        title = eval(tlt[i].split(':')[1])
        location = eval(loc[i].split(':')[1])
        location = location.split(' ')[0]
        sales = eval(sale[i].split(':')[1])
        sales = re.match(r'\d+',sales).group(0)
        print(price)
        with open("月饼数据.txt",'a',encoding='utf-8') as f:
        print(f)
        f.write(title+','+price+','+sales+','+location+'\n')
    except:
    print("")

def main():
goods="月饼"
depth=100
start_url = 'https://s.taobao.com/search?q=' + goods
for i in range(depth):
try:
url = start_url + '&s=' + str(44 * i)
print('url=',url)
html = get_html_text(url)
parse_page(html)
except:
continue
main()

知识点:Response对象的属性
r.status_code HTTP请求的返回状态,200表示连接成功,404表示失败 ;
r.text HTTP响应内容的字符串形式,即url对应的页面内容;
r.encoding 从HTTP header中猜测的响应内容编码方式;
r.apparent_encoding 从内容中分析出的响应内容编码方式(备选编码方式);

三、数据清洗预览


由上图可以看出,全网月饼的均价在90元左右,最贵月饼价高达9999元,较高销量为355444(数据为当前爬取数据为准)

四、数据分析可视化
广式月饼风采依旧,蛋黄、莲蓉口味深受最爱

结论:
广式月饼、礼盒装占比很高;从口味上来看,蛋黄口味占比很高,比莲蓉,五仁都高,其他口味豆沙、水果、火腿等次之;从品牌商家来看,北京稻香村、广东华美排名靠前;从礼盒装、企业、员工、团购、批发来看,淘宝网也是企业采购月饼送员工的渠道之一。
详情代码如下:
import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
import matplotlib
from pyecharts import Geo,Style,Line,Bar,Overlap
from wordcloud import WordCloud, ImageColorGenerator
from os import path
from pylab import mpl
import jieba

f = open(r"C:\Users\Administrator\Desktop\月饼数据.txt",encoding='utf-8')

df = pd.read_csv(f,sep=',',names=['title','price','sales','location'])

title = df.title.values.tolist()

#对每个标题进行分词
title_s = []

for line in title:
title_cut = jieba.lcut(line)
title_s.append(title_cut)

title_clean = []

#停用词表
stopwords = ["月饼","礼品","口味","礼盒","包邮","【","】","送礼","大",
"中秋节","中秋月饼","2","饼","蓉","多","个","味","斤","送"," ","老",
"北京","云南","网红老"]

#剔除停用词表
for line in title_s:
line_clean = []
for word in line:
if word not in stopwords:
line_clean.append(word)
title_clean.append(line_clean)

title_clean_dist = []

#进行去重
for line in title_clean:
line_dist = []
for word in line:
if word not in line_dist:
line_dist.append(word)
title_clean_dist.append(line_dist)

allwords_clean_dist = []
for line in title_clean_dist:
for word in line:
allwords_clean_dist.append(word)

df_allwords_clean_dist = pd.DataFrame({'allwords':allwords_clean_dist})

#对过滤_去重词语进行汇总统计
word_count = df_allwords_clean_dist.allwords.value_counts().reset_index()
word_count.columns = ['word','count']

backgroud_Image = plt.imread('1.jpg')

wc = WordCloud(width=1024,height=768,background_color='white',

mask=backgroud_Image,font_path="C:\simhei.ttf",max_font_size=400,
random_state=50)

wc = wc.fit_words({x[0]:x[1] for x in word_count.head(100).values})

plt.imshow(wc,interpolation='bilinear')
plt.axis("off")
plt.show()

d = path.dirname(__file__)

wc.to_file(path.join(d,"yuebing.png"))

知识点:
font_path : string //字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = '黑体.ttf';
mask : nd-array or None (default=None) //如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。 除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread('读取一张图片.png'), 背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了;
stopwords : set of strings or None //设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS ;
background_color : color value (default=”black”) //背景颜色,如background_color='white',背景颜色为白色; 
max_font_size : int or None (default=None) //显示的较大的字体大小 ;
fit_words(frequencies) //根据词频生成词云(frequencies,为字典类型)

不同关键词word对应的sales之和的统计分析

(说明:例如 词语 ‘广式’,则统计商品标题中含有‘广式’一词的商品的销量之和,即求出具有‘广式’风格的商品销量之和)


由上图可以看出:礼盒装、广式、蛋黄、莲蓉、五仁、稻香村、华美等关键词靠前,也再次验证了广式月饼堪称月饼之王,实际付款人高达近700万,广式月饼可谓是风采依旧。虽然广式月饼起源于广州,但凭借其松软的饼皮和多元丰富的馅料,实际已经在全国各地流行开来,成为名副其实的“月饼之王”。
详情代码如下:
w_s_sum = []
for w in word_count.word:
i = 0
s_list = []
for t in title_clean_dist:
if w in t:
s_list.append(df.sales[i])
i+= 1
w_s_sum.append(sum(s_list))

df_w_s_sum = pd.DataFrame({'w_s_sum':w_s_sum})
df_word_sum = pd.concat([word_count,df_w_s_sum],axis=1,ignore_index=True)
df_word_sum.columns = ['word','count','w_s_sum']
df_word_sum.sort_values('w_s_sum',inplace=True,ascending=True)
df_w_s = df_word_sum.tail(30)

attr = df_w_s['word']
v1 = df_w_s['w_s_sum']

bar = Bar("月饼关键词销量分布图")

bar.add("关键词",attr,v1,is_stack=True,xaxis_rotate=30,yaxix_min=4.2,

    xaxis_interval=0,is_splitline_show=False)

overlap = Overlap()

overlap.add(bar)

overlap.render('月饼关键词_销量分布图.html')

多数商品销量为3000以下,占比高达90%


由上图看出,销售量在10万以上的寥寥无几,共8种,其中销售量30万以上就有6款。当今网红经济下,爆品为王,一款独大;正所谓网红就是营销,爆品就是产品,有了好的产品再经过营销的运作就能产生十倍的放大效益, 如果没有好的产品,光有营销企业也难以长久。要利用网红经济来打造爆款,选择爆款一定要有自己的特色,在销售的过程中,客户的评价对产品的搜索排序和客户下单转化起着至关重要的作用;

消费降级?均价在10-100元占比50%


商品数量随着价格总体呈现下降阶梯形势,价格越高,在售的商品越少;低价位商品居多,价格在10-100之间的商品最多,100-200之间的次之,价格8000以上的商品较少。

详情代码如下:
f = open(r"C:\Users\Administrator\Desktop\月饼数据.txt",encoding='utf-8')

df = pd.read_csv(f,sep=',',names=['title','price','sales','location'])

print(df.sort_values(by='price'))

price_info = df[['price','location']]

bins = [0,10,50,100,150,200,300,500,1000,5000,8000]
level = ['0-10','10-50', '50-100','100-150' ,'150-200', '200-500','500-1000','1000-5000','5000-8000','8000以上']

price_stage = pd.cut(price_info['price'], bins = bins,labels = level).value_counts().sort_index()
print(price_stage)

attr = price_stage.index
v1 = price_stage.values

bar = Bar("价格区间&月饼种类数量分布")
bar.add("",attr,v1,is_stack=True,xaxis_rotate=30,yaxix_min=4.2,
    xaxis_interval=0,is_splitline_show=False)

overlap = Overlap()
overlap.add(bar)
overlap.render('价格区间&月饼种类数量分布.html')

后记:

由上图可看出,全网Top15中,广式口味占80%,全国各地都在卖广式月饼。月饼种类那么多,为何偏偏是广式月饼横行中国?广式月饼外层是糖浆皮,以小麦粉、糖浆、植物油、碱水等原料制作烘烤而成,这并非中国传统的糕饼技艺,这与广式月饼的起源有关。广东流行中秋月饼比中国其他地区的时间更晚,要迟到晚清时期。在此之前,广州沙面地区已因鸦片战争变为英、法租界,各类西饼店纷纷踏上广州地界。以糖浆皮包裹烘烤而成的广式月饼,其实是学习西式糕点作法的产物。

广式月饼能一统天下,最重要的一条是广式月饼的原料,这个原料就是莲蓉。早在1889年,当时广州城西的一家叫“莲香楼”的糕酥店,将莲子熬成莲蓉作馅料,做成的酥饼清香可口,大受欢迎。后来,莲香楼的生产者将这种莲蓉馅料的饼点定型为月饼,逐渐形成后来的广式月饼。

声明:文章收集于网络,如有侵权,请联系小编及时处理,谢谢!

欢迎加入本站公开兴趣群
软件开发技术群
兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流
QQ群:26931708

Hadoop源代码研究群
兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop
QQ群:288410967 

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-02-20 19:22 , Processed in 0.125569 second(s), 25 queries .