C题这是想干嘛,2021年美赛C题提前15天发数据?

2021美赛C题思路

链接

通知内容

发布时间:2021年1月9号,下午6点51分。
在这里插入图片描述

分析

主要信息已经给出:美赛C题数据比较,提前15天于2021年1月21号发出,赛题正常时间给出。
那么唯一得信息量是数据量大。针对这个特点做如下分析:可是没说具体的规模。储存上是几百M还是几个G还是更大。不过庆幸的是大多数数据处理软件是没有数据规模限制的。我知道的除了excel的存储上限是100万行左右,但是超过50万行就会运行卡顿,不过数据未必有这么大。其他的比较流行的python、R语言、matlab、PowerBI都不会对数据有什么上限的要求,有也是很高的上限。其中PowerBi是类似于excel的作图思路。他的拖拉拽相对其他编程软件简单易上手尤其是用过excel的数据透视图的人来说。推荐大家抽时间突击一下。
我平时R语言用的比较多,接下来我会写几篇文章介绍一下R语言中处理大数据的一下工具和技巧。有兴趣的可以持续关注一下。记得是R语言、R语言、R语言。
在之前我也写过一些比较好的包的使用,虽然冰山一角,这里给大家总结列出几篇。

1、R语言入门——sqldf包 VS dplyr包

介绍了两个包一个是tidyverse的核心包dplyr,一个是调用sql语句的sqldf包。分别从数据筛选、排序、分组汇总、选择变量等角度做的实例。

2、R语言入门——批量读取文件

介绍了批量读取文件的一些技巧。

3、数据可视化——一文入门ggplot2

ggplot2也是tidyverse的核心包。本文介绍了一些基本的语法。

4、R语言入门——数据快速读取与查看

介绍了一些常用数据的读取以及大型数据快速读取的一些参数。

总结

最后希望可以帮助大家学习R语言。水平有限发现错误还望及时评论区指正,您的意见和批评是我不断前进的动力。

《2021美赛数据读取》

为了提供便利,对于数据的读取会在下面网站及时更新:2021美赛C题数据读取

已标记关键词 清除标记
相关推荐
©️2020 CSDN 皮肤主题: 像素格子 设计师:CSDN官方博客 返回首页