Setelah menemukan sejuta aplikasi dengan crawling Play Store, mereka mengunduh file APK dan mengelompokkannya berdasarkan kategori aplikasi serta kesamaan visual yang dibagikan aplikasi. Mereka juga memperhitungkan deskripsi teks menjiplak 10.000 aplikasi terpopuler di Play Store.
Model machine learning multi-modal embedding menemukan 49.608 potensi palsu. Aplikasi yang diidentifikasi kemudian diperiksa menggunakan private API dari VirusTotal, alat analisis malware online yang diakuisisi Google pada 2012.
Di sisi lain, paper juga memperhitungkan izin yang diminta aplikasi ini dan perpustakaan iklan pihak ketiga yang menyertainya. Tapi, paper mencatat, sekitar 35 persen aplikasi tidak lagi tersedia di Play Store, berpotensi dihapus karena keluhan pengguna.