Tabla de enlaces
Resumen e I. Introducción
II. Modelo de amenaza y antecedentes
Iii. Webcam mirando a través de gafas
IV. Reconocimiento de reflexión y factores
V. Susceptibilidad del objetivo textual del ciberespacio
VI. Reconocimiento del sitio net
Vii. Discusión
Viii. Trabajo relacionado
Ix. Conclusión, reconocimiento y referencias
Apéndice A: Información del equipo
Apéndice B: Modelo de ángulo de visión
Apéndice C: comportamientos de la plataforma de videoconferencia
Apéndice D: Análisis de distorsión
Apéndice E: objetivos textuales net
VI. Reconocimiento del sitio net
Los resultados hasta ahora sugieren que aún puede ser un desafío para los adversarios de la cámara net precise con cámaras de 720p convencionales para escuchar a espiar los contenidos textuales comunes que se muestran en las pantallas del usuario. Durante nuestra experimentación, observamos que reconocer contenidos gráficos, como formas y diseños en la pantalla, es generalmente más fácil que leer textos. Aunque las formas y los diseños contienen información de grano más grueso en comparación con los textos, una cámara net que asomaba el adversario aún puede representar amenazas no triviales al correlacionar dicha información gráfica con contextos sensibles a la privacidad. Este trabajo exploró más a fondo en qué grado puede una cámara net que se asoma a los sitios net en pantalla utilizando información gráfica no textual.
Recopilación de datos. 10 de los 20 participantes en el estudio del usuario participaron en la evaluación de reconocimiento del sitio net. Siguiendo una metodología related que en [42]Utilizamos los 100 sitios net de Alexa Prime 100 como un conjunto de datos del mundo cerrado. Solo investigamos el reconocimiento de la página de inicio de cada sitio net en este trabajo. [42] muestra que otras páginas de un sitio net también pueden conducir al reconocimiento del sitio net. Creemos que vale la pena explorar la facilidad de reconocer un sitio net que usa diferentes páginas en futuras obras. El experimento siguió un procedimiento related al experimento de reconocimiento textual en la Sección V. Para cada participante, un autor genera una secuencia aleatoria única de 25 sitios net para que el participante navegue (10 segundos para cada sitio net) mientras que otro autor actúa como el adversario que analiza las grabaciones de video. El adversario obtuvo y reconoció las grabaciones remotas locales como con el zoom como el adversario. El adversario recibió toda la grabación y se le pidió que coincidiera con cada segmento del video con un sitio net específico de los 100 sitios net en el orden correcto. Se supone que un adversario ingenuo de suposición aleatoria tiene una tasa de éxito de aproximadamente el 1%. Tenga en cuenta que algunos participantes cambiaron su entorno e iluminación ambiental en comparación con el experimento de reconocimiento textual anterior, ya que los dos experimentos se realizaron con cinco meses de diferencia.
Resultados de reconocimiento. La Figura 10 muestra el porcentaje de sitios net (de 25) reconocido correctamente por el adversario. Los participantes 0 y 4 no produjeron reflexiones reconocibles debido a los malos SNR de luz y ángulos de visualización respectivamente. Esta relación de reconocimiento cero (2 de cada 10) está de acuerdo con la de la prueba de reconocimiento textual (6 de 20), lo que sugiere que la consulta de la cámara net puede ser imposible en las ocasiones de videoconferencia del 20-30% debido a las configuraciones extremas del entorno de usuario.
Como se esperaba, los participantes con mayores precisiones de reconocimiento textual, como el participante 7, generalmente también producen mayores precisiones de reconocimiento del sitio net. Además, observamos que el reconocimiento del sitio net es más robusto para varias condiciones de iluminación en el entorno ambiente de los participantes. Por ejemplo, encontramos el participante 10 que tenía una precisión de reconocimiento textual del 0% debido a la SNR de luz mala producía el 56% (native) y el 36% (remoto) precisiones en el reconocimiento del sitio net con el mismo entorno e iluminación. Las razones son dobles. Primero, los contenidos gráficos sólidos, como los bloques de coloration que se encuentran comúnmente en las páginas net, ocupan áreas más grandes que el cuerpo de los textos y, por lo tanto, son mucho más fáciles de identificar en movies de baja calidad. En segundo lugar, en comparación con los textos negros en fondos blancos que solo tienen dos colores diferentes, las páginas net generales con múltiples contenidos gráficos tienen más colores y contraste, lo que lleva a una mejor robustez contra la exposición sobre y la subexposición de los contenidos de pantalla utilizables en los movies de la webcam.
Reconocimiento de facilidad y características net. En comparación con los textos, los sitios net cuentan con características más abundantes y diversas. Realizamos análisis cualitativos y cuantitativos para identificar las características que hacen que ciertos sitios net sean más susceptibles a la consulta de la cámara net. Con ese fin, clasificamos los 100 sitios net por su facilidad de reconocimiento utilizando precisiones de reconocimiento. La Figura 16 muestra capturas de pantalla giradas de los sitios net que clasifican los 15 mejores e inferiores por su facilidad de reconocimiento. Las inspecciones visuales sugieren que los sitios net con mayor contraste, bloques de coloration más grandes y posiciones relativas más destacadas entre diferentes bloques de coloration son más fáciles de reconocer. Los sitios net que son en su mayoría blancos con componentes textuales y gráficos escasos en ellos son los más difíciles de reconocer. Calculamos los puntajes de correlación entre el rango de cada sitio net y la desviación promedio, así como la desviación estándar de los valores de píxeles de los sitios net. En normal, un promedio más alto significa que el sitio net está más cerca de una pantalla blanca pura; Una desviación estándar más alta significa que el sitio net tiene texturas de alto contraste más abundantes. Las puntuaciones de correlación obtenidas son -0.33 y 0.45.
Autores:
(1) Yan Lengthy, Ingeniería Eléctrica e Informática, Universidad de Michigan, Ann Arbor, EE. UU. ([email protected]);
(2) Chen Yan, Facultad de Ingeniería Eléctrica, Universidad de Zhejiang, Hangzhou, China ([email protected]);
(3) Shilin Xiao, Facultad de Ingeniería Eléctrica, Universidad de Zhejiang, Hangzhou, China ([email protected]);
(4) Shivan Prasad, Ingeniería Eléctrica e Informática, Universidad de Michigan, Ann Arbor, EE. UU. ([email protected]);
(5) Wenyuan Xu, Facultad de Ingeniería Eléctrica, Universidad de Zhejiang, Hangzhou, China ([email protected]);
(6) Kevin Fu, Ingeniería e Informática Eléctrica, Universidad de Michigan, Ann Arbor, EE. UU. ([email protected]).
Este documento es