Artikel

5: Data dan Statistik


5: Data dan Statistik

Data dan Statistik Banci A.S.

Biro Banci Amerika Syarikat menyediakan data mengenai bangsa dan negara dan ekonomi. Setiap 10 tahun, ia melakukan Banci Penduduk dan Perumahan, di mana setiap penduduk di Amerika Syarikat dihitung. Agensi ini juga mengumpulkan data melalui lebih daripada 100 tinjauan isi rumah dan perniagaan lain setiap satu hingga lima tahun. Anda boleh meneroka hasil tinjauan atau mencari fakta ringkas yang popular.

Banci 2020 berakhir pada bulan Oktober, 2020. Lihat kembali prosesnya.

Bagaimana data dari banci digunakan?

Tanggapan anda dapat membantu menentukan berapa banyak dana yang akan diterima oleh masyarakat tempatan anda untuk perkhidmatan awam. Data populasi banci digunakan untuk membahagikan kerusi di Dewan Perwakilan A.S. di antara 50 negeri. Ini juga dapat digunakan untuk menarik batas untuk daerah perundangan dan sekolah negeri.

Selain menggunakan data banci untuk kepentingan perkhidmatan awam, anda juga dapat menggunakannya untuk penelitian silsilah. Untuk melindungi privasi orang yang bertindak balas terhadap Banci A.S., semua rekod dirahsiakan selama 72 tahun. Ketahui maklumat salasilah apa yang ada dan di mana anda boleh mengaksesnya.

Statistik apa yang boleh saya perolehi dari bancian?

Dapatkan maklumat penduduk dan demografi mengenai negara, setiap negara dan banyak lagi:

Zum masuk dan urutkan data banci dengan peta interaktif.

Lihat anggaran populasi A.S. dan dunia yang berubah secara langsung dengan Jam Penduduk.

Lihat data umur dan jantina untuk memahami perubahan populasi dari masa ke masa.

Bagaimana saya dapat melihat hasil bancian?

Kaji semua tinjauan dan data mereka yang dilakukan oleh Biro:

Perlukah saya menjawab bancian?

Secara undang-undang, setiap orang diharuskan dihitung dalam bancian. Sekiranya anda tidak menjawab, Biro Banci A.S. akan menghubungi anda secara peribadi dengan mengunjungi rumah anda.


Data & Statistik

Covid-Relief-Data.ed.gov didedikasikan untuk mengumpulkan dan menyebarkan data dan maklumat mengenai tiga program Dana Penstabilan Pendidikan (ESF) utama yang dikendalikan oleh Jabatan Pendidikan dan diberi kuasa oleh Bantuan, Bantuan, dan Keselamatan Ekonomi Coronavirus (CARES) Bertindak.

Pusat Statistik Pendidikan Nasional (NCES)

Entiti persekutuan utama untuk mengumpulkan dan menganalisis data yang berkaitan dengan pendidikan di A.S. dan negara lain.

Fakta pantas

Kad Markah Kolej

College Scorecard menyediakan data yang membantu calon pelajar dan peguam bela mereka mencari yang sesuai untuk pendidikan pasca sekolah menengah. Laman pengguna College Scorecard membolehkan pengguna mencari dan membandingkan kolej berdasarkan sekumpulan elemen data yang diserlahkan seperti kadar tamat pengajian, kos tahunan rata-rata, kadar pembayaran pinjaman, pendapatan pasca penyelesaian untuk bidang pengajian tertentu, dan banyak lagi. Penyelidik dan pembangun juga mempunyai akses ke lebih daripada 2,000 elemen data yang boleh dimuat turun yang diaktifkan melalui antara muka pengaturcaraan aplikasi.


Berapa Banyak Data Dibuat Setiap Hari pada tahun 2021?

Pernah terfikir berapa banyak data yang dibuat setiap hari? Atau mungkin anda ingin mengetahui berapa banyak data yang digunakan oleh orang biasa di rumah? Terima kasih kepada penemuan teknologi mudah alih seperti telefon pintar dan tablet , bersama dengan inovasi dalam rangkaian mudah alih dan WiFi , penciptaan dan penggunaan data terus berkembang.

Oleh itu, berapa banyak data yang dihasilkan setiap hari di dunia yang celik teknologi ini? Sebelum kita menyelidiki perinciannya, berikut adalah gambaran keseluruhan ringkas.

Statistik Pertumbuhan Data yang Menakjubkan (Pilihan Editor)

Kini dapat melihat berapa banyak data yang dibuat setiap hari, dan juga berapa banyak data yang kita gunakan secara berkala. Anda mungkin terkejut apabila mengetahui bahawa:

  • Pada tahun 2020, orang membuat 1.7 MB data setiap saat.
  • Menjelang tahun 2022, 70% daripada KDNK dunia akan mengalami pendigitan.
  • Pada tahun 2021, 68% pengguna Instagram melihat foto dari jenama.
  • Menjelang tahun 2025, 200+ zettabytes data akan berada di penyimpanan awan di seluruh dunia.
  • Pada tahun 2020, pengguna menghantar sekitar 500,000 Tweet setiap hari.
  • Menjelang akhir tahun 2020, 44 zettabait akan membentuk keseluruhan dunia digital.
  • Setiap hari, 306.4 bilion e-mel dihantar, dan 500 juta Tweet dibuat.

Berapa Banyak Data Yang Kita Gunakan?

Dan sekarang, masa untuk membungkus ... Bercanda, bercanda.

Memandangkan jumlah data di internet, jumlah data sebenar yang digunakan sukar dikira.

Tetapi jika kita bercakap tentang berapa banyak data yang dibuat setiap hari anggaran semasa 1.145 trilion MB sehari .

1. Rata-rata, setiap manusia mencipta sekurang-kurangnya 1.7 MB data sesaat pada tahun 2020.

Mengapa 1.7 MB? Statistik kami seterusnya akan memberikan perspektif yang lebih banyak.

2. Kami membuat 2.5 quintillion bait data setiap hari pada tahun 2020.

Sekiranya anda tertanya-tanya berapa banyak data yang rata-rata orang menggunakan sebulan, anda boleh memulakan dengan melihat berapa banyak data yang dibuat orang setiap hari pada tahun 2020 secara purata. Angka itu berdiri 2.5 quintillion bait sehari.

Terdapat 18 angka nol dalam satu perempat. Cuma FYI.

3. 463 exabytes data akan dihasilkan setiap hari oleh orang pada tahun 2025.

Berdasarkan berapa banyak data yang telah dihasilkan setiap hari oleh manusia melalui media sosial, perkongsian video, dan komunikasi , jumlahnya pasti akan bertambah.

Sekarang mari kita bincangkan mengenai internet.

Walaupun anda membaca ini, peranti anda menyimpan banyak data yang tidak dapat digunakan. Anda mungkin mempertimbangkan untuk menggunakan alat untuk mengosongkan ruang dan membuang fail yang tidak diperlukan.

Statistik Pertumbuhan Internet

Statistik pertumbuhan penggunaan internet memberitahu kita bahawa orang di seluruh dunia berada semakin mendapat akses ke internet . Secara logiknya, bilangan pengguna internet dan pertanyaan carian juga semakin meningkat. Kadar pertumbuhan maklumat yang mengagumkan ini hanya akan diteruskan.

Cuba teka berapa ramai pengguna internet yang aktif di sana.

4. Terdapat 4.66 bilion pengguna internet aktif di seluruh dunia pada Januari 2021.

Pertumbuhan internet statistik dari Statista menunjukkan bahawa 4.66 bilion orang menggunakan internet pada Januari 2021. Itu hampir 60% daripada populasi dunia.

Itu pertumbuhan yang mengejutkan, dengan mengingat bahawa hanya ada 2.6 bilion pengguna internet pada tahun 2013.

Ia kelihatan seperti telefon bimbit lebih popular daripada peranti lain, dengan 4.28 bilion pengguna unik. Dengan kemudahan mudah alih menjadi ciri utama bagi kebanyakan laman web hari ini, itu masuk akal.

Ngomong-ngomong, adakah anda tahu berapa banyak laman web yang ada? Inilah jawapannya.

5. Terdapat 319 juta pengguna internet baru pada tahun 2020.

Menurut pertumbuhan statistik internet, 300+ juta pengguna baru menyertai internet pada tahun 2020. Sehingga 2021, kadar pertumbuhan adalah 7%, menerjemahkan ke sekitar 875K pengguna baru / hari.

6. Akhir 2021 dapat melihat dua trilion carian Google.

Google adalah enjin carian nombor satu , dengan Pangsa pasaran 91%. Ingin tahu berapa orang yang menggunakan Google?

E xperts meramalkan bahawa carian enjin akan berjumlah lebih kurang 2 trilion pada keseluruhan tahun 2021. Itu sama dengan 6 bilion carian sehari.

Statistik Penggunaan Media Sosial

Berapa banyak data yang dibuat setiap hari di media sosial? Statistik penggunaan media sosial sendiri menunjukkan jumlah yang lumayan. Berikut adalah beberapa pandangan mengenai platform popular Facebook dan Twitter .

7. 15% kandungan di Facebook adalah video.

(Sumber: Orang Dalam Sosial)

Video membuat jejak mereka di Facebook, the rangkaian media sosial terbesar. Pada tahun 2020, terdapat 10.5 juta video di laman web. 71% dari mereka berasal mempunyai lebih daripada 100,000 pengikut.

8. Lima ratus ribu Tweet baru disiarkan setiap hari pada tahun 2020.

Sukar untuk memahami berapa banyak Tweet pengguna menghantar setiap hari .

Setengah juta Tweet dalam sehari adalah looot!

Itu hampir menjadi hampir dua bilion setahun. Sekarang bayangkan berapa banyak jenama pelanggan berpotensi yang dapat dijangkau menggunakan mod ini.

9. Facebook menghasilkan empat petabyte data setiap hari pada tahun 2020.

Seperti yang anda ketahui, satu petabyte sama dengan satu juta gigabait. Jadi bagaimana Facebook menggunakan empat petabyte sehari?

Itu disebabkan jumlah masa yang dihabiskan pengguna di Facebook, seperti yang ditunjukkan oleh statistik pertumbuhan data sepanjang tahun 2020. Sebenarnya, orang berada di Facebook lebih banyak daripada rangkaian sosial lain.

"Facebook sudah mati." Pasti, TikTok-ers, pasti. Sekiranya anda tahu berapa banyak orang Amerika yang menggunakan Facebook.

10. 68% lalu lintas Instagram melihat gambar jenama pada tahun 2021.

Hampir 70% pelawat pada Instagram adalah melihat gambar dari jenama pada tahun 2021. Video jenama tidak terlalu buruk, dengan 66% penonton.

Jadi, apa lagi yang diperhatikan oleh orang ketika berada di platform media sosial?

Berikut adalah pecahan bagi metrik yang paling terkenal:

Statistik Pertumbuhan Video

Statistik pertumbuhan video memberitahu kami bahawa YouTube, Twitch dan Snapchat cenderung menjadi platform sosial yang paling popular untuk perkongsian video. Apa yang menarik adalah perbezaan data yang mereka gunakan secara individu.

11. Video 480p di YouTube menggunakan 8.3MB seminit dan 500MB per jam.

‘Berapa banyak data yang digunakan video YouTube?’ Adalah soalan yang agak biasa.

Ini sangat bergantung pada kualiti video yang dimainkan. 480p adalah definisi standard , bagaimanapun, tetapan berkualiti tinggi seperti 1080p pasti akan menggunakan lebih banyak data.

12. Video 480p di Twitch menggunakan antara 0.405GB dan 0.54GB per jam.

Walaupun ini mungkin tidak banyak (dan sebenarnya, tidak), kebenarannya adalah lebih daripada platform lain seperti Youtube dan Snapchat .

13. Anda memerlukan 1MB untuk menghantar satu Snapchat.

Sekiranya anda ingin mengetahui berapa banyak data yang digunakan Snapchat , Saya takut ada tiada data awam yang berkaitan. Walau bagaimanapun, dianggarkan bahawa satu kos Snapchat 1MB untuk dihantar.

Ingat bahawa anda memerlukan lebih banyak daripada itu untuk gambar, video, atau Snapchat berdefinisi tinggi dengan penapis.

14. Pada tahun 2020, masa tontonan video di Twitter meningkat 72%.

Twitter dulu terkenal dengan catatan yang berukuran bit. Kini, penayangan video di laman web ini berkembang pesat. Pada tahun 2020, ia meningkat sebanyak 72%. Ini adalah masa yang tepat untuk jenama memanfaatkan penyiaran video di platform.

Statistik Komunikasi

Seberapa kerap anda menggunakan aplikasi atau alat komunikasi mempunyai pengaruh besar terhadap seberapa banyak data dibuat setiap hari.

15. Satu mesej teks hanya menggunakan setara dengan 0.0001335 MB data.

(Sumber: Side Hustle Nation)

Menentukan data yang digunakan berdasarkan berapa banyak teks yang dihantar setiap hari agak sukar. Mesej SMS biasanya disertakan dalam paket telepon, oleh sebab itu mengapa kita tidak dapat menggambar angka yang tepat. Apa yang kita tahu adalah bahawa 0.0001335MB , jumlah data yang digunakan dalam mengirim satu teks, tidak begitu mengejutkan.

16. Berkongsi mesej di WhatsApp biasanya hanya menggunakan data Kilobyte.

Berminat untuk mengetahui berapa banyak data WhatsApp penggunaan setiap mesej? Kebenarannya adalah bahawa biasanya tidak banyak. Namun, jika anda berkongsi video, ini boleh digunakan lebih daripada 1MB data. Sebenarnya, ini biasanya menggunakan antara 500MB dan 2GB data.

17. Berharap untuk menggunakan antara 0.5MB dan 1.3MB seminit untuk panggilan VoIP.

Sekali lagi, pemboleh ubah. Semuanya turun ke teknologi yang digunakan oleh anda Penyedia VoIP , serta kebiasaan penggunaan peribadi anda sendiri.

18. Pada tahun 2024, jumlah e-mel akan menjadi sekitar 361 bilion setiap hari.

Statistik pertumbuhan data menunjukkan bahawa jumlah e-mel harian yang melintasi web akan meningkat sebanyak 55.2 bilion dalam beberapa tahun akan datang. Cara komunikasi terus menjadi pilihan untuk jenama dan individu, walaupun terdapat kemajuan dalam aplikasi sembang dan pesanan.

Statistik Pertumbuhan Data Besar

Statistik pertumbuhan data pada tahun 2021 memberitahu kami bahawa data besar berkembang pada kadar yang belum pernah terjadi sebelumnya. The sebahagian besar data dunia hanya berlaku di dua tahun kebelakangan seperti yang ditunjukkan oleh statistik pertumbuhan data. Sementara itu, data yang dihasilkan mesin akan menyumbang 40% data internet tahun ini. Syukurlah, kami mempunyai alat visualisasi data untuk menjadikan semua data ini dapat difahami.

19. Hampir 70% daripada KDNK akan menjalani pendigitan menjelang tahun 2022.

Pelajaran terbesar yang diajarkan oleh Covid-19 mengenai ekonomi ialah pendigitan adalah yang terpenting. Paling banyak kelebihan yang ketara ialah kerja masih boleh diteruskan tanpa melapor ke lokasi kerja fizikal.

Statistik pertumbuhan data menunjukkan bahawa pada tahun 2022, lebih 70% daripada KDNK di seluruh dunia akan melalui beberapa bentuk digitalisasi. Permintaan untuk perisian kerjasama, penyelesaian awan, dan perkhidmatan tanpa hubungan akan meningkat ketika Kerajaan dan organisasi berusaha untuk menjauh dari sistem analog.

Menjelang 2023, pelaburan di Transformasi Digital Langsung (DXT) akan berjumlah $ 6.8 trilion. Organisasi akan terus mengerjakan sistem yang ada selama ini untuk mencari jalan yang lebih baik untuk penyampaian perkhidmatan, tenaga kerja yang diedarkan, dan pemotongan kos.

20. Penyimpanan data awan di seluruh dunia akan berjumlah 200+ Zettabyte menjelang 2025.

(Sumber: Majalah Cybercrime)

Pertumbuhan data simpanan statistik menunjukkan bahawa oth awam dan awan peribadi infrastruktur akan menerima 200+ zettabyte (ZB) data menjelang 2025. Itu akan meningkat dari 4.4ZB 2019 dan 44ZB 2020.

Itu akan menjadi pedang bermata dua.

The positif perniagaan akan mencapai sebahagian besar perniagaan mereka digitalisasi merancang untuk menghasilkan data tersebut. The keburukan akan begitu jenayah siber akan berkembang maju.

Tetapi itu hanya akan berlaku jika organisasi dan pemerintah menjatuhkan bola keselamatan siber, yang kemungkinannya kurang.

21. Data yang dihasilkan mesin menyumbang lebih dari 40% data internet pada tahun 2020.

(Sumber: Buku Panduan Penyelidikan Infrastruktur Awan untuk Analisis Data Besar )

Statistik mengenai pembelajaran mesin data pertumbuhan dan pertumbuhan data web menunjukkan bahawa manusia menghasilkan 60% data di internet tahun lalu. The bahasa mesin global nilai akan berjumlah $ 117.19 bilion pada akhir tahun 2027.

Statistik Pertumbuhan IoT

IoT tidak menunjukkan tanda melambatkan. Sebenarnya, industri ini berkembang pesat . Sebagai bilangan peranti IoT bertambah , jumlah pengguna aktif dan langganan meningkat juga. Berikut adalah tiga statistik penting yang perlu anda ketahui Teknologi IoT .

22. Menjelang tahun 2023, terdapat sekitar 1.3 bilion langganan IoT.

Jadi mengapa angka ini begitu tinggi? Walaupun banyak peranti IoT isi rumah memang ada, banyak daripadanya digunakan di luar rumah di tempat seperti kilang dan hospital.

23. Bilangan peranti IoT akan mencapai 25.44 bilion pada tahun 2030.

Pada tahun 2019, jumlah peranti yang disambungkan hanya 7.74 bilion. Menjelang 2030, jumlah itu akan meningkat tiga kali ganda, menurut statistik pertumbuhan data.

Di segmen pengguna, kes penggunaan utama untuk teknologi tersebut adalah peranti media seperti telefon pintar. Contoh lain termasuk grid pintar, penjejakan aset & pemantauan amp, kenderaan autonomi, dan infrastruktur IT.

24. China mempunyai 3.17 bilion peranti IoT pada tahun 2020.

China mempunyai lebih dari tiga bilion alat yang terhubung dengan IoT pada tahun 2020. Ketika menghabiskan peralatan, China berada di puncak di wilayah Asia Pasifik dengan $ 168 bilion pada tahun 2019. Korea Selatan berada di tempat kedua dengan $ 26 bilion.

Ramalan menunjukkan bahawa wilayah APAC akan menjadi pengeluaran IoT terbesar pada tahun 2030.

Berapa Ukuran Data?

Sekarang mari & # 8217s melihat bagaimana data kecil menjadi data besar.

Berapa bait?

1 bait sama dengan 0.001 kilobyte.

Berapa kilobyte?

1 kilobyte sama dengan 1024 bait.

Berapa megabait?

1 megabait sama dengan 1024 kilobyte.

Berapa gigabait?

1 gigabait sama dengan sekitar 1024 megabait.

Berapa terabyte?

Berapa petabyte?

1 petabyte sama dengan 1024 terabyte.

Berapa banyak exabyte?

1 exabyte sama dengan kira-kira 1024 petabyte.

Berapa zaitun?

1 zettabyte sama dengan satu trilion gigabait.

Berapa yottabyte?

1 yottabyte sama dengan 1,204 zettabyte.

Kami kini secara rasmi merasa seperti Count von Count.

Kemaskan

Statistik pertumbuhan data memberikan sejumlah besar. Dan mereka hanya akan menjadi lebih besar.

Semakin ramai orang mendapat akses ke internet setiap hari , orang menggunakan media sosial dan bentuk komunikasi digital lain seperti Panggilan VoIP dan aplikasi teks lagi dan lagi. Itulah sebabnya mengapa perisian visualisasi data dan alat infografik semakin popular sejak kebelakangan ini & # 8211 mereka dapat mengubah banyak data menjadi maklumat yang mudah dicerna.

Memandangkan bahawa majoriti data & # 8217s dunia telah dihasilkan dalam dua tahun terakhir sahaja, akan menarik untuk mengemukakan soalan ‘berapa banyak data dibuat setiap hari & # 8217 dalam masa lima atau sepuluh tahun & # 8217 waktu.

Adakah anda fikir Count von Count akan dapat mengira itu?

Ya. Sebenarnya, statistik pertumbuhan pusat data memberitahu bahawa dalam beberapa tahun akan datang pusat data akan bertambah. Statistik pertumbuhan pusat data simpanan memberitahu kami bahawa ini akan berlaku antara 12% dan 14% .

Pertumbuhan data dalam statistik iklan menunjukkan bahawa menargetkan semula adalah kaedah yang popular untuk menggabungkan iklan dengan data. Ia berfungsi dengan baik, seperti 43% pelawat yang disasarkan semula melakukan pertukaran kepada pelanggan yang membayar.

Menurut statistik pertumbuhan penjualan internet, mereka adalah. Mereka meningkat tahun dan tahun sejak itu 2014 , dan tidak ada tanda-tanda penurunan di masa hadapan. India menunjukkan ramalan CAGR paling makmur sehingga 2023 (17.8%) diikuti oleh Sepanyol (11.1%) dan China (11%).

Sekiranya anda tertanya-tanya berapa banyak data yang dibuat setiap hari dan di mana, ketahui bahawa media sosial adalah salah satu sebab utama di sebalik jumlah besar yang kita lihat.

Statistik penggunaan media sosial mengikut negara memberitahu kami bahawa pengambilan adalah tertinggi di UAE pada 99% . Ia juga popular di Taiwan dan Korea Selatan (masing-masing 88% dan 87%) .

Sumber

Saya adalah penghubung yang dilahirkan secara semula jadi, terkenal dengan perkongsian perniagaan yang lama dan berkesan. Saya didorong oleh semangat saya untuk sumber manusia dan cinta saya yang tulus untuk berhubung dengan orang lain. Sehingga kini, pengetahuan & tekad saya untuk mengubah maklumat menjadi tindakan & inisiatif telah menyumbang kepada kejayaan kerjaya saya. HR adalah sesuatu yang saya hidup dan bernafas, dan saya tahu kesannya dalam mengubah perniagaan dan kehidupan mereka yang bekerja di dalamnya.


Membuat Grafik Data Anda untuk Mengenal Peluang

Kotak petak, histogram, dan petak penyebaran dapat menonjolkan garis besar.

Kotak petak memaparkan tanda bintang atau simbol lain pada grafik untuk menunjukkan dengan jelas apabila set data mengandungi garis luar. Grafik ini menggunakan kaedah interquartile dengan pagar untuk mencari outliers, yang saya terangkan kemudian. Kotak petak di bawah memaparkan set data contoh kami. Ini jelas bahawa outliernya agak berbeza daripada nilai data biasa.

Anda juga boleh menggunakan boxplot untuk mencari outliers ketika anda mempunyai kumpulan dalam data anda. Petak kotak di bawah menunjukkan set data yang berbeza yang mempunyai outlier dalam kumpulan Kaedah 2. Klik di sini untuk mengetahui lebih lanjut mengenai kotak kotak.

Histogram juga menekankan kewujudan outliers. Cari bar terpencil, seperti gambar di bawah. Outlier kami adalah bar di sebelah kanan. Grafik tersebut merangkumi titik data yang sah di paling kiri.

Sebilangan besar outliers yang saya bincangkan dalam post ini adalah outli univariate. Kami melihat sebaran data untuk satu pemboleh ubah dan mencari nilai yang berada di luar taburan. Walau bagaimanapun, anda boleh menggunakan petak penyebaran untuk mengesan penyimpangan dalam tetapan multivariate.

Dalam grafik di bawah, kami & # 39; meneliti dua pemboleh ubah, Input dan Output. Petak penyebaran dengan garis regresi menunjukkan bagaimana kebanyakan titik mengikuti garis yang sesuai untuk model. Walau bagaimanapun, titik bulat tidak sesuai dengan model.

Menariknya, nilai Input (

14) untuk pemerhatian ini sama sekali tidak biasa kerana nilai Input lain berkisar antara 10 hingga 20 pada paksi-X. Juga, perhatikan bagaimana nilai Output (

50) sama dalam julat nilai pada paksi-Y (10 & ndash 60). Nilai Input dan Output sendiri tidak biasa dalam set data ini. Sebaliknya, ia & # 39; rsquos yang lebih baik kerana tidak sesuai dengan model.

Jenis outlier ini boleh menjadi masalah dalam analisis regresi. Memandangkan sifat regresi multivariasi pelbagai aspek, terdapat banyak jenis penyimpangan di wilayah tersebut. Dalam ebook saya mengenai analisis regresi, saya memperincikan pelbagai kaedah dan ujian untuk mengenal pasti outliers dalam konteks multivariate.

Untuk sepanjang siaran ini, kami & rsquoll akan menumpukan pada univariate outliers.


Data & # 038 Statistik

Laporan 2020 yang diterbitkan di American Journal of Preventive Medicine mendapati bahawa penggunaan alkohol semasa dan minuman keras di kalangan wanita hamil berumur 18 & ndash44 tahun di Amerika Syarikat meningkat sedikit dari 2011 hingga 2018.

  • Minuman semasa (mempunyai sekurang-kurangnya satu minuman minuman beralkohol dalam 30 hari terakhir) meningkat daripada 9.2% pada tahun 2011 kepada 11.3% pada tahun 2018.
  • Minum minuman keras (minum empat atau lebih minuman pada 30 hari yang lalu) meningkat dari 2.5% kepada 4.0% dalam jangka masa yang sama.

Pemeriksaan penggunaan alkohol digabungkan dengan kaunseling ringkas oleh penyedia perkhidmatan kesihatan dapat mengurangkan penggunaan alkohol semasa kehamilan dan risiko FASD.

Penemuan Utama: Penggunaan alkohol dan minuman keras di kalangan wanita hamil berumur 18 & ndash44 tahun & ndash Amerika Syarikat, 2015 & ndash2017

Pada tahun 2019 Laporan Mingguan Morbiditi dan Kematian Artikel (MMWR), penyelidik CDC mendapati bahawa kira-kira 1 dari 9 wanita hamil melaporkan minum alkohol * dalam 30 hari terakhir. Di kalangan wanita hamil, kira-kira satu pertiga yang melaporkan minum alkohol terlibat dalam minuman keras. & Belati Wanita hamil yang melaporkan minuman keras dalam 30 hari terakhir melaporkan rata-rata 4.5 episod minuman keras dalam tempoh masa yang sama.

Pendedahan alkohol semasa kehamilan boleh membahayakan otak bayi yang sedang berkembang dan boleh mengakibatkan gangguan spektrum alkohol janin (FASD). Pemeriksaan penggunaan alkohol, digabungkan dengan kaunseling ringkas, dapat mengurangkan penggunaan alkohol semasa kehamilan dan mengurangkan risiko FASD dan hasil kehamilan dan kelahiran negatif yang lain.

* Minum alkohol didefinisikan sebagai sekurang-kurangnya satu minuman minuman beralkohol dalam 30 hari terakhir.
& belati Minum minuman keras ditakrifkan sebagai minum empat atau lebih minuman sekurang-kurangnya satu kali dalam 30 hari terakhir.

Laporan CDC: Pemeriksaan Penggunaan Alkohol dan Kaunseling Ringkas Orang Dewasa & 13 Negeri dan Daerah Columbia, 2017

Minum minuman keras meningkatkan risiko kecederaan, gangguan spektrum alkohol janin, dan beberapa penyakit kronik seperti barah payudara. Laporan ini mendapati bahawa walaupun 81% orang dewasa AS di 13 negeri dan Washington, D.C. dilaporkan ditanya oleh penyedia penjagaan kesihatan mereka mengenai penggunaan alkohol, hanya sekitar 38% yang dilaporkan ditanya mengenai minuman keras semasa pemeriksaan rutin dalam 2 tahun terakhir. Minum minuman keras adalah 5 atau lebih minuman untuk lelaki dan 4 atau lebih untuk wanita. Di kalangan orang dewasa yang dilaporkan ditanya mengenai penggunaan alkohol mereka semasa pemeriksaan dalam 2 tahun yang lalu dan melaporkan minuman keras semasa, 80% (atau 4 dari 5 orang) adalah tidak menasihati untuk mengurangkan minum. Pemeriksaan alkohol secara rutin dan kaunseling singkat terbukti efektif dalam mengurangi minuman keras dan disyorkan untuk semua orang dewasa.

Kumpulan Data Penggunaan Alkohol

Sistem Pengawasan Faktor Risiko Tingkah Laku (BRFSS): Tinjauan telefon ini mengesan tingkah laku risiko kesihatan nasional dan negeri bagi orang dewasa, berumur 18 tahun dan lebih tua, di Amerika Syarikat. BRFSS ditadbir dan disokong oleh Bahagian Kesihatan Orang Dewasa dan Komuniti, Pusat Nasional Pencegahan Penyakit Kronik dan Promosi Kesihatan, CDC.

Tinjauan Wawancara Kesihatan Nasional (NHIS): NHIS adalah tinjauan kesihatan rumah tangga serbaguna di seluruh negara penduduk AS yang tidak berperlembagaan yang dilakukan setiap tahun oleh Pusat Statistik Kesihatan Nasional (NCHS), CDC, untuk menghasilkan anggaran nasional untuk pelbagai petunjuk kesihatan .

Ikon kajian Nasional mengenai Penggunaan Dadah dan Kesihatan luaran: Tinjauan ini memberikan maklumat mengenai kelaziman, corak, dan akibat alkohol, tembakau, dan penggunaan dan penyalahgunaan dadah secara haram pada populasi A.S., yang berumur 12 tahun ke atas. Ia dilakukan oleh ikon luaran Pentadbiran Penyalahgunaan Bahan dan Kesihatan Mental.

Kesan Penyakit Berkaitan Alkohol (ARDI): Perisian ini, yang disokong oleh Pusat Nasional Pencegahan dan Promosi Kesihatan Penyakit Kronik CDC & rsquos, menghasilkan anggaran kematian berkaitan alkohol dan Tahun Potensi Kehilangan Kehidupan (YPLL) kerana penggunaan alkohol.

Rujukan

1 CDC. Sindrom alkohol janin-Alaska, Arizona, Colorado, dan New York, 1995-1997. MMWR Morb Mortal Wkly Perwakilan 200251 (20): 433-5. [Baca artikel]

2 CDC. Sindrom Alkohol Janin di kalangan Kanak-kanak Berumur 7-9 Tahun & ndash Arizona, Colorado, dan New York, 2010. MMWR Morb Mortal Wkly Rep. 201564 (3): 54-57. [Baca artikel]

3 Mei PA, Baete A, Russo J, Elliott AJ, Blankenship J, Kalberg WO, Buckley D, Brooks M, Hasken J, Abdul-Rahman O, Ahli Parlimen Adam, Robinson LK, Manning M, Hoyme HE. Kelaziman dan ciri gangguan spektrum alkohol janin. Pediatrik. 2014134: 855-66. [Baca ringkasan ikon luaran]

4 Mei PA, Gossage JP, Kalberg WO, Robinson LK, Buckley D, Manning M, Hoyme HE. Prevalensi dan ciri epidemiologi FASD dari pelbagai kaedah penyelidikan dengan penekanan pada kajian baru-baru ini di sekolah. Dev Disabil Res Rev. 200915: 176-92. [Baca ringkasan ikon luaran]

5 Mei PA, Chambers CD, Kalberg WO, Zellner J, Feldman H, Buckley D, Kopald D, Hasken JM, Xu R, Honerkamp-Smith G, Taras H, Manning MA, Robinson LK, Ahli Parlimen Adam, Abdul-Rahman O, Vaux K, Jewett T, Elliott AJ, Kable JA, Akshoomoff N, Falk D, Arroyo JA, Hereld D, Riley EP, Charness ME, Coles CD, Warren KR, Jones KL, Hoyme HE. Kelaziman Gangguan Spektrum Alkohol Janin di 4 Komuniti AS. Jurnal Persatuan Perubatan Amerika. 2018319 (5): 474 & ndash482. [Baca ikon luaran artikel]


Kemas kini Terakhir: Januari 2018

Pusat Sumber Maklumat Kesihatan Mental Institut Nasional

Terdapat dalam Bahasa Inggeris dan español

Jam: 8:30 pagi hingga 5 petang Waktu Timur, M-F

Telefon: 1-866-615-6464
TTY: 1-301-443-8431
TTY (bebas tol): 1-866-415-8051

Sembang dalam talian secara langsung: Bercakap dengan wakil
E-mel: [email protected]
Faks: 1-301-443-4279

Mel: Institut Kesihatan Mental Negara
Pejabat Sains, Dasar, Perancangan, dan Komunikasi
6001 Executive Boulevard, Bilik 6200, MSC 9663
Bethesda, MD 20892-9663


Penceritaan Data: Kemahiran Sains Data Penting Yang Diperlukan Semua Orang

Setelah perniagaan anda mula mengumpulkan dan menggabungkan semua jenis data, langkah sukar difahami seterusnya adalah mengekstrak nilai daripadanya. Data anda mungkin mengandungi sejumlah besar potensi nilai, tetapi tidak satu ons nilai dapat dibuat melainkan wawasan tidak ditemui dan diterjemahkan ke dalam tindakan atau hasil perniagaan. Semasa wawancara tahun 2009, Ketua Ekonom Google Dr. Hal R.Varian menyatakan, "Keupayaan mengambil data — untuk dapat memahaminya, memprosesnya, mengekstrak nilai daripadanya, untuk memvisualisasikannya, untuk menyampaikannya - itu akan terjadi menjadi kemahiran yang sangat penting dalam beberapa dekad akan datang. " Menjelang tahun 2016 dan banyak perniagaan akan bersetuju dengan penilaian bijak Varian.

Ketua Pakar Ekonomi Google, Dr. Hal R. Varian meramalkan kepentingan kemahiran data semakin meningkat. [+] 2009. (Foto oleh Imeh Akpanudosen / Getty Images for Variety)

Oleh kerana data menjadi semakin banyak di mana-mana, syarikat sangat mencari bakat dengan kemahiran data ini. LinkedIn yang baru-baru ini melaporkan analisis data adalah salah satu kategori kemahiran terpanas selama dua tahun terakhir untuk perekrut, dan itu adalah satu-satunya kategori yang secara konsisten berada di kedudukan 4 teratas di seluruh semua negara yang mereka analisis. Menariknya, sebahagian besar penekanan pengambilan pekerja sekarang berpusat pada kemahiran penyediaan data dan analisis — bukan kemahiran "batu terakhir" yang membantu mengubah pandangan menjadi tindakan. Sebilangan besar individu yang banyak direkrut dengan ijazah lanjutan dalam bidang ekonomi, matematik, atau statistik berjuang untuk menyampaikan pandangan mereka kepada orang lain dengan berkesan — pada dasarnya, menceritakan jumlah mereka.

Keperluan untuk lebih banyak pencerita data hanya akan meningkat pada masa akan datang. Dengan peralihan ke arah kemampuan layan diri yang lebih banyak dalam analitik dan kecerdasan perniagaan, kumpulan orang yang menghasilkan wawasan akan berkembang melampaui hanya penganalisis dan saintis data. Alat data generasi baru ini akan memudahkan orang di seluruh fungsi perniagaan untuk mengakses dan meneroka data mereka sendiri. Hasilnya, kita akan melihat sejumlah pandangan yang belum pernah terjadi sebelumnya dalam syarikat berbanding sebelumnya. Namun, melainkan jika kita dapat meningkatkan komunikasi pandangan ini, kita juga akan melihat kadar penukaran wawasan-ke-nilai yang lebih rendah. Sekiranya pandangan tidak difahami dan tidak memikat, tidak ada yang akan bertindak dan tiada perubahan akan berlaku.

Pakar visualisasi data Stephen Few berkata, "Angka mempunyai kisah penting untuk diceritakan. Mereka bergantung pada anda untuk memberi mereka suara yang jelas dan meyakinkan. " Sebarang pandangan yang patut dikongsi mungkin paling baik dikongsi sebagai kisah data. Frasa "penceritaan data" telah dikaitkan dengan banyak hal — visualisasi data, infografik, papan pemuka, presentasi data, dan sebagainya. Seringkali penceritaan data ditafsirkan sebagai hanya memvisualisasikan data secara berkesan, namun, ia lebih daripada sekadar membuat carta data yang menarik secara visual. Penceritaan data adalah pendekatan terstruktur untuk menyampaikan wawasan data, dan ia melibatkan gabungan tiga elemen penting: data, visual, dan naratif.

Penting untuk memahami bagaimana unsur-unsur yang berbeza ini bergabung dan berfungsi bersama dalam penceritaan data. Apabila naratif digabungkan dengan data, ia berguna untuk terangkan kepada khalayak anda apa yang berlaku dalam data dan mengapa pandangan tertentu penting. Konteks dan komen yang cukup sering diperlukan untuk menghayati pandangan. Apabila visual diterapkan pada data, mereka dapat menyedarkan khalayak dapat mengetahui bahawa mereka tidak akan melihat tanpa carta atau grafik. Banyak corak dan garis besar yang menarik dalam data akan tetap tersembunyi di baris dan lajur jadual data tanpa bantuan visualisasi data.

Akhirnya, apabila naratif dan visual digabungkan, mereka dapat bertunang atau menghiburkan penonton. Tidak hairanlah kita secara kolektif menghabiskan berbilion-bilion dolar setiap tahun di filem-filem untuk membenamkan diri dalam kehidupan, dunia, dan pengembaraan yang berbeza. Apabila anda menggabungkan visual dan naratif yang betul dengan data yang tepat, anda mempunyai kisah data yang dapat mempengaruhi dan mendorong ubah.

Mengapa penceritaan data penting

Selama beribu-ribu tahun, penceritaan telah menjadi sebahagian daripada kemanusiaan kita. Walaupun di zaman digital kita, kisah-kisah terus menarik perhatian kita sama seperti yang mereka lakukan kepada nenek moyang kita dahulu. Cerita memainkan peranan penting dalam kehidupan seharian kita - dari hiburan yang kita habiskan hingga pengalaman yang kita kongsi dengan orang lain hingga apa yang kita buat dalam impian kita.

Penceritaan zaman moden sering dikaitkan dengan siri persidangan TED yang popular dan slogan "Ideas Worth Spreading." Analisis persembahan 500 TED Talk yang paling popular mendapati bahawa cerita merangkumi sekurang-kurangnya 65% kandungannya. Sepanjang masa, penceritaan terbukti menjadi mekanisme penyampaian yang kuat untuk berkongsi pandangan dan idea dengan cara yang tidak dapat dilupakan, meyakinkan, dan menarik.

Bagi sebilangan orang, membuat cerita mengenai data mungkin kelihatan seperti usaha yang tidak perlu dan memakan masa. Mereka mungkin merasakan pandangan atau fakta harus cukup untuk berdiri sendiri selagi mereka dilaporkan dengan cara yang jelas. Mereka mungkin percaya bahawa wawasan yang diungkap sahaja harus mempengaruhi keputusan yang tepat dan mendorong penonton mereka untuk bertindak. Sayangnya, sudut pandang ini didasarkan pada anggapan yang salah bahawa keputusan perniagaan hanya berdasarkan logik dan akal.

Sebenarnya, ahli sains saraf telah mengesahkan bahawa keputusan sering berdasarkan emosi, bukan logik. Profesor USC Antonio Damasio mendapati pesakit, yang mengalami kerosakan otak di kawasan yang membantu memproses emosi (korteks prefrontal), berjuang untuk membuat keputusan asas ketika memilih antara alternatif. Memutuskan tempat makan atau kapan menjadualkan janji temu bertukar menjadi perbahasan kos-faedah yang panjang bagi individu-individu ini. Menariknya, kemahiran membuat keputusan pesakit ini secara signifikan terganggu oleh kurangnya pertimbangan emosi. Emosi sebenarnya memainkan peranan penting dalam membantu otak kita mencari alternatif dan membuat keputusan tepat pada masanya.

Apabila anda mengumpulkan wawasan anda sebagai kisah data, anda membina jambatan untuk data anda ke sisi otak yang berpengaruh dan emosional. When neuroscientists observed the effects detailed information had on an audience, brain scans revealed it only activated two areas of the brain associated with language processing: Broca’s area and Wernicke’s area. However, when someone is absorbed in a story, they discovered it stimulated more areas of the brain. People hear statistics, but they feel stories . This subtle but important difference pays dividends for data storytellers in a few key ways:

  • Memorability: A study by Stanford professor Chip Heath (Made to Stick author) found 63% could remember stories, but only 5% could remember a single statistic. While 2.5 statistics were used on average in the exercise and only 10% of the participants incorporated a story, the stories are what caught people’s attention.
  • Persuasiveness: In another study, researchers tested two variations of a brochure for the Save the Children charity organization. The story-based version outperformed the infographic version by $2.38 to $1.14 in terms of per participant donations. Various statistics on the plight of African children were far less persuasive than the story of Rokia, a seven-year-old from Mali, Africa.
  • Engagement: Researchers also discovered people enter into a trance-like state, where they drop their intellectual guard and are less critical and skeptical. Rather than nitpicking over the details, the audience wants to see where the story leads them. As mathematician John Allen Paulos observed, “In listening to stories we tend to suspend disbelief in order to be entertained, whereas in evaluating statistics we generally have an opposite inclination to suspend belief in order not to be beguiled.”

In a previous article, I shared an account of Ignaz Semmelweis, a mid-nineteenth century obstetrician, who discovered hand washing could save countless lives but failed to communicate his findings effectively to a skeptical medical community. His data was ignored, his life-saving ideas were rejected, and he was sadly discredited by his colleagues.

Many bold, incredible insights will suffer a similar fate if they are not successfully molded into data stories. Uncovering key insights is one skill and communicating them is another—both are equally critical to deriving value from the data your business is now amassing. Data storytelling represents an exciting, new field of expertise where art and science truly converge. My hope is more data storytellers—from across an organization—will emerge to ensure the survival and adoption of more transformative insights.


2 What They're Calling an "Epidemic" May Actually Be Random Chance

Studies show that people who live near power lines have a higher rate of cancer and other diseases! That means electricity is quietly killing you from within! It's a good thing that right this minute, your face isn't near any glowing devices that run on electricity .


"You kids get down from there, you'll catch the cancer!"

The "power lines cause cancer" thing was a real study that caused real panic not too many years ago. They looked at a map, drew a circle around people who lived near power lines, and looked up what diseases those people had. Sure enough, it wasn't hard to find neighborhoods just chock full of tumors.

But in doing so, they fell victim to what is called the Texas sharpshooter fallacy, or the clustering illusion -- that's when you see false patterns in random data. The name alludes to a theoretical cowboy who shoots randomly at the side of a barn, then paints a target wherever the most shots are clustered together and tells people he's a sharpshooter.

The truth is that in a large enough population, you're going to get random patterns -- especially if you give yourself infinite room to find similarities. For instance, the above study may also have found that kids living near power lines are 5 percent more likely to be named "Steve," or that they are 3 percent more likely to prefer red bicycles. When you're talking about tiny differences, you can find all sorts of weird-ass connections. So, they found that in some areas, kids were up to four times as likely to have leukemia (holy shit! Power lines are murdering our children!), but they ignored the fact that in other areas, the kids were actually kurang likely to have it (holy shit! Power lines have magical healing abilities!). In reality, it was all averaging out.

And if you just found yourself saying, "Yeah, but with those kids who were four times as likely to get sick, there has to be something to it," you've already forgotten at least two of the points in this article (hint: leukemia is rare and it doesn't take many cases to get a fourfold increase).

Remember that crazy story about the guy in Miami who went insane and ate another dude's face off? Then every day after that, there was another story of a biting attack? Even the skeptics were all "Wow, another crazy person bit somebody on the subway! There has to be something to this."

And there was: When humans get into fights, we tend to bite each other, but only in the wake of the Miami thing was there any reason for such incidents to become news -- the only thing that changed was that suddenly every bite became a headline. We started looking for a pattern, and there it was. Then we quickly got bored with it, even though right now somebody, somewhere, is biting someone else.

Over the centuries, this fallacy has caused us to invent entire epidemics out of whole cloth. Hell, this is even thought to be one of the reasons for the "witch hunts" that took place throughout history (or, you know, today) -- everyone in the neighborhood suddenly got sick, there's a weird woman living in the neighborhood, therefore said woman must have caused the sickness using her devil magic.

Now, sometimes the trend is in fact real, but caused by something totally unrelated. That brings us to the biggest fallacy of them all .

Related: Simply Staggering Facts About The Opioid Epidemic


5: Data and Statistics

– Steve Morgan, Editor-in-Chief

Sausalito, Calif. – Mar. 29, 2020

Cybercrime Magazine extrapolates the top 5 market data points from our research in order to summarize the cybersecurity industry through 2021.

Although the numbers listed below have been featured and quoted (with attribution to us as the source) by hundreds of major media outlets, vendors, academia, governments, associations, event producers, and industry experts — the material is all original research which first appeared in reports published by Cybersecurity Ventures.

1. Cybercrime damage costs are predicted to hit $6 trillion annually by 2021.

This represents the greatest transfer of economic wealth in history, risks the incentives for innovation and investment, and will be more profitable than the global trade of all major illegal drugs combined.

Cybercrime costs include damage and destruction of data, stolen money, lost productivity, theft of intellectual property, theft of personal and financial data, embezzlement, fraud, post-attack disruption to the normal course of business, forensic investigation, restoration and deletion of hacked data and systems, and reputational harm.

2. Cybersecurity spending will exceed $1 trillion from 2017 to 2021.

The cybersecurity market is continuing its stratospheric growth and hurtling towards the trillion dollar mark that we originally predicted in 2017.

In 2004, the global cybersecurity market was worth $3.5 billion — and in 2017 it was expected to be worth more than $120 billion. The cybersecurity market grew by roughly 35X over 13 years entering our most recent prediction cycle.

3. The world will have 3.5 million unfilled cybersecurity jobs by the end of 2021.

Every IT position is also a cybersecurity position now. Every IT worker, every technology worker, needs to be involved with protecting and defending apps, data, devices, infrastructure and people.

There will be 3.5 million unfilled cybersecurity jobs by 2021 — enough to fill 50 NFL stadiums — according to Cybersecurity Ventures. This is up from Cisco’s previous estimation of 1 million cybersecurity openings in 2014.

The cybersecurity unemployment rate is at zero percent in 2019, where it’s been since 2011.

4. Ransomware damage costs are predicted to grow more than 57X from 2015 to 2021.

Ransomware attacks on healthcare organizations — often called the No. 1 cyber-attacked industry — will quadruple by 2020.

Cybersecurity Ventures expects that a business will fall victim to a ransomware attack every 11 seconds by 2021, up from every 14 seconds in 2019. This makes ransomware the fastest growing type of cybercrime.

5. 70 percent of cryptocurrency transactions will be for illegal activity by 2021

Cryptocrime is an emerging segment of the cybercrime ecosystem, and it’s booming.

Around $76 billion of illegal activity per year involves bitcoin, which is close to the scale of the U.S. and European markets for illegal drugs, according to a study published by the University of Sydney in Australia, ranked as one of the top 100 universities globally.

Cybersecurity Ventures predicts that by 2021 more than 70 percent of all cryptocurrency transactions annually will be for illegal activity, up from current estimates ranging anywhere from 20 percent (of the 5 major cryptocurrencies) to nearly 50 percent (of bitcoin).

Stay tuned for a year-end update with more cybersecurity market research from the editors at Cybersecurity Ventures.

Steve Morgan is founder and Editor-in-Chief at Cybersecurity Ventures.

Go here to read all of my blogs and articles covering cybersecurity. Go here to send me story tips, feedback and suggestions.


Tonton videonya: Статистика (Oktober 2021).