Authors:

Autores

Person role Person
7517
754,768,3252
7516
754,768,3252
7515
754,768,3252

Informations:

Pesc publication

Title
A Multi-Dimensional Approach to Understanding the Effect of Page Content and Infrastructure on Page Load Time
Research area
Computer Networks
Publication type
Master's thesis
Identification Number
Date
12/12/2024
Resumo

Este estudo examina o papel crucial do \textit{page load time} (PLT) na era digital, onde páginas web servem como fontes essenciais de informação, entretenimento e comércio. Ao reconhecer o impacto significativo do PLT na experiência do usuário, otimização de ferramentas de busca e taxas de conversão, nós abordamos não só o estado atual das métricas de complexidade de páginas, mais especificamente métricas de conteúdo e infraestrutura, via o uso de métodos estatísticos, mas também como elas afetam o PLT.

Nós usamos modelos de aprendizado de máquina, tanto supervisionados quanto não supervisionados, para analisar a influência dessas métricas em múltiplos níveis: página única, categoria de página, cluster e geral. Esta abordagem multi-dimensional permite um entendimento holístico da relação entre métricas de complexidade de página e PLT.

Nosso estudo conclui que a quantidade de bytes, requisições e imagens distintas são as variáveis mais importantes para predição de PLT, com o modelo por categoria de página sendo, em geral, melhor do que os outros. Também encontramos um valor de RMSE (raiz quadrada do erro médio ao quadrado) de menos de um, para a maioria dos modelos, indicando alta acurácia na estimação de PLT.

Os resultados contribuem para um entendimento mais profundo dos determinantes de PLT e ajudam a encontrar caminhos para otimização de páginas web para melhor experiência de usuário e resultados de negócios. Este estudo mostra a necessidade de foco contínuo na questão de PLT no cenário dinâmico de tecnologias web e engajamento de usuários.

Abstract

This study delves into the critical role of page load time (PLT) in the digital age, where web pages serve as essential gateways to information, entertainment, and commerce. Recognizing PLT's significant impact on user experience, search engine optimization, and conversion rates, we look at not only the current state of page complexity metrics, specifically content and infrastructure, via the use of statistical methods, but also how they affect PLT.

We employ both supervised and unsupervised machine learning models to analyze the influence of these metrics at multiple levels: single page, page category, cluster, and general. This multi-dimensional approach allows for a comprehensive understanding of the relationship between page complexity metrics and PLT. 

Our study finds that the number of bytes, requests, and distinct images are key features in PLT prediction, with the page category model generally outperforming others. We also report a root mean squared error (RMSE) of less than one in most models, indicating high accuracy in PLT estimation.

The findings contribute to a deeper understanding of the determinants of PLT and offer insights into optimizing web pages for better user experiences and business outcomes. This research underscores the need for continued focus on PLT in the evolving landscape of web technology and user engagement.

JSN_TPLFW_GOTO_TOP