まずは、簡単に PVとETV(離脱率)で散布図
xyplot(d1$etv+d1$e.rate~d1$pv,cex=0.6,xlab="PV",ylab="離脱率(ETVと通常)")
weightedSortの正確を示してると思う。分母(今回はPV)が上がらないと、全体の平均値から逃れることはできない。
また、ページ別のPVはべき乗則になってることもわかる。
ETVだけにして、指数での表示になおす、
plot(d1$pv,d1$etv,xlab="PV", ylab="ETV(離脱率)", log="x")
abline(v=25)
データがしょぼいけど、PV20前後から平均値からの離脱が始まってるイメージ。
もちろん、これは事前分布での精度をどれくらいにするかにかかってる。
今回は、maxのPV=>273を使用してる。10分の1くらい加味されてぐらいで、傾向が取れるという話になるのかなあ、、、なんとも言いがたいけど、、、で、PV>25以上でランキングをつくり直す。
tmp1 <- d1[d1$pv>25,c("etv","pv","Page")]
R> tmp1[rev(order(tmp1$etv)),]
etv pv Page
2 0.71 218 /what_are_visits_entrances_uniqueviews_pageviews_in_google_analytics
1 0.70 157 /multi-cookie-tracking
4 0.65 142 /what_is_user_in_google_analytics
3 0.63 54 /gnur-with-google-analytics
7 0.62 146 /measure_how_much_viewed_in_google_analytics
5 0.61 65 /wordpressにcse。iframe編
6 0.61 104 /track_outbound_as_a_event_and_pageview
8 0.61 86 /referral_data_against_date
9 0.60 68 /automate_reporting_google_apps_script
11 0.60 42 /複数ドメインのtracking
10 0.60 42 /ab_test_in_google_analytics
12 0.60 60 /revise_my_analysis_followed_by_workshop_for_web_analytics1
20 0.58 27 /funnels_with_advanced_segment_on_google_analytics
29 0.58 26 /google-analytics-の-cookieについて。理解度6割
280 0.55 26 /data-feeds-query-explorer-in-windows-application
281 0.54 32 /landingpage_analysis
282 0.52 66 /business
283 0.52 54 /automate_visualizing_pages_transitions
284 0.41 273 /
285 0.34 183 /transition_repot