Teorema de Naimark

O teorema de Naimark é um fato fundamental sobre medições. Ele afirma que toda medição geral pode ser implementada de uma forma simples que lembra as representações de Stinespring de canais:

O sistema a ser medido é primeiro combinado com um sistema de workspace inicializado, formando um sistema composto.
Uma operação unitária é então realizada no sistema composto.
Por fim, o sistema de workspace é medido com respeito a uma medição na base padrão, produzindo o resultado da medição geral original.

Enunciado e prova do teorema

Seja $\mathsf{X}$ um sistema e seja $\{P_0,\ldots,P_{m-1}\}$ uma coleção de matrizes semidefinidas positivas satisfazendo

P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}},

ou seja, elas descrevem uma medição de $\mathsf{X}.$ Seja também $\mathsf{Y}$ um sistema cujo conjunto de estados clássicos é $\{0,\ldots,m-1\},$ que é o conjunto de possíveis resultados dessa medição.

O teorema de Naimark afirma que existe uma operação unitária $U$ no sistema composto $(\mathsf{Y},\mathsf{X})$ tal que a implementação sugerida pela figura a seguir produz resultados de medição que concordam com a medição dada $\{P_0,\ldots,P_{m-1}\},$ ou seja, as probabilidades para os diferentes resultados de medição possíveis estão precisamente em acordo.

Uma implementação de uma medição geral como no teorema de Naimark

Para ficar claro, o sistema $\mathsf{X}$ começa em algum estado arbitrário $\rho$ enquanto $\mathsf{Y}$ é inicializado no estado $\vert 0\rangle$ . A operação unitária $U$ é aplicada a $(\mathsf{Y},\mathsf{X})$ e então o sistema $\mathsf{Y}$ é medido com uma medição na base padrão, produzindo algum resultado $a\in\{0,\ldots,m-1\}.$

O sistema $\mathsf{X}$ é representado como parte da saída do circuito, mas por ora não vamos nos preocupar com o estado de $\mathsf{X}$ após a aplicação de $U$ , e podemos imaginar que ele é traçado para fora. No entanto, vamos nos interessar pelo estado de $\mathsf{X}$ após $U$ ser aplicado mais adiante nesta lição.

Uma implementação de uma medição dessa forma é claramente reminiscente de uma representação de Stinespring de um canal, e os fundamentos matemáticos são similares também. A diferença aqui é que o sistema de workspace é medido em vez de ser traçado para fora, como no caso de uma representação de Stinespring.

O fato de que toda medição pode ser implementada dessa forma é bastante simples de provar, mas precisamos primeiro de um fato sobre matrizes semidefinidas positivas.

Fato

Suponha que $P$ é uma matriz semidefinida positiva $n \times n$ . Existe uma única matriz semidefinida positiva $n\times n$ $Q$ para a qual $Q^2 = P.$ Essa única matriz semidefinida positiva é chamada de raiz quadrada de $P$ e é denotada $\sqrt{P}.$

Uma maneira de encontrar a raiz quadrada de uma matriz semidefinida positiva é primeiro calcular uma decomposição espectral.

P = \sum_{k=0}^{n-1} \lambda_k \vert \psi_k \rangle \langle \psi_k \vert

Como $P$ é semidefinida positiva, seus autovalores devem ser números reais não negativos, e ao substituí-los por suas raízes quadradas obtemos uma expressão para a raiz quadrada de $P.$

\sqrt{P} = \sum_{k=0}^{n-1} \sqrt{\lambda_k} \vert \psi_k \rangle \langle \psi_k \vert

Com esse conceito em mãos, estamos prontos para provar o teorema de Naimark. Assumindo que $\mathsf{X}$ tem $n$ estados clássicos, uma operação unitária $U$ no par $(\mathsf{Y},\mathsf{X})$ pode ser representada por uma matriz $nm\times nm$ , que podemos ver como uma matriz de blocos $m\times m$ cujos blocos são $n\times n.$ A chave da prova é tomar $U$ como qualquer matriz unitária que corresponda ao seguinte padrão.

U = \begin{pmatrix} \sqrt{P_0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \sqrt{P_1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Para que seja possível preencher os blocos marcados com interrogação de modo que $U$ seja unitária, é necessário e suficiente que as primeiras $n$ colunas, formadas pelos blocos $\sqrt{P_0},\ldots,\sqrt{P_{m-1}},$ sejam ortonormais. Podemos então usar o processo de ortonormalização de Gram-Schmidt para preencher as colunas restantes, como vimos na lição anterior.

As primeiras $n$ colunas de $U$ podem ser expressas como vetores da seguinte forma, onde $c = 0,\ldots,n-1$ se refere ao número da coluna começando do $0.$

\vert\gamma_c\rangle = \sum_{a = 0}^{m-1} \vert a \rangle \otimes \sqrt{P_a} \vert c\rangle

Podemos calcular o produto interno entre quaisquer dois deles da seguinte forma.

\langle \gamma_c \vert \gamma_d \rangle = \sum_{a,b = 0}^{m-1} \langle a \vert b \rangle \cdot \langle c \vert \sqrt{P_a}\sqrt{P_b}\, \vert d\rangle = \langle c \vert \Biggl(\sum_{a = 0}^{m-1} P_a \Biggr) \vert d\rangle = \langle c \vert d\rangle

Isso mostra que essas colunas são de fato ortonormais, então podemos preencher as colunas restantes de $U$ de uma forma que garante que a matriz inteira seja unitária.

Resta verificar que as probabilidades de resultado da medição para a simulação são consistentes com a medição original. Para um dado estado inicial $\rho$ de $\mathsf{X},$ a medição descrita pela coleção $\{P_0,\ldots,P_{m-1}\}$ resulta em cada resultado $a\in\{0,\ldots,m-1\}$ com probabilidade $\operatorname{Tr}(P_a \rho).$

Para obter as probabilidades de resultado para a simulação, vamos primeiro dar o nome $\sigma$ ao estado de $(\mathsf{Y},\mathsf{X})$ após $U$ ter sido aplicada. Esse estado pode ser expresso da seguinte forma.

\sigma = U \bigl(\vert 0\rangle \langle 0 \vert \otimes \rho\bigr) U^{\dagger} = \sum_{a,b=0}^{m-1} \vert a\rangle \langle b \vert \otimes \sqrt{P_a} \rho \sqrt{P_b}

Equivalentemente, na forma de matriz de blocos, temos a seguinte equação.

\begin{aligned} \sigma & = \begin{pmatrix} \sqrt{P_0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \sqrt{P_1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix} \begin{pmatrix} \rho & 0 & \cdots & 0 \\[1mm] 0 & 0 & \cdots & 0 \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] 0 & 0 & \cdots & 0 \end{pmatrix} \begin{pmatrix} \sqrt{P_0} & \sqrt{P_1} & \cdots & \sqrt{P_{m-1}} \\[1mm] \fbox{?} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \fbox{?} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}\\[5mm] & = \begin{pmatrix} \sqrt{P_0}\rho\sqrt{P_0} & \cdots & \sqrt{P_0}\rho\sqrt{P_{m-1}} \\[1mm] \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}}\rho\sqrt{P_0} & \cdots & \sqrt{P_{m-1}}\rho\sqrt{P_{m-1}} \end{pmatrix} \end{aligned}

Note que as entradas de $U$ nos blocos marcados com interrogação não têm influência no resultado, em virtude do fato de que estamos conjugando uma matriz da forma $\vert 0 \rangle \langle 0 \vert \otimes \rho$ — portanto, as entradas com interrogação são sempre multiplicadas por entradas zero de $\vert 0 \rangle \langle 0 \vert \otimes \rho$ quando o produto matricial é calculado.

Agora podemos analisar o que acontece quando uma medição na base padrão é realizada em $\mathsf{Y}.$ As probabilidades dos resultados possíveis são dadas pelas entradas diagonais do estado reduzido $\sigma_{\mathsf{Y}}$ de $\mathsf{Y}.$

\sigma_{\mathsf{Y}} = \sum_{a,b=0}^{m-1} \operatorname{Tr}\Bigl(\sqrt{P_a} \rho \sqrt{P_b}\Bigr) \vert a\rangle \langle b \vert

Em particular, usando a propriedade cíclica do traço, vemos que a probabilidade de obter um dado resultado $a\in\{0,\ldots,m-1\}$ é a seguinte.

\langle a \vert \sigma_{\mathsf{Y}} \vert a \rangle = \operatorname{Tr}\Bigl(\sqrt{P_a} \rho \sqrt{P_a}\Bigr) = \operatorname{Tr}(P_a \rho)

Isso coincide com a medição original, estabelecendo a correção da simulação.

Medições não destrutivas

Até agora nesta lição, nos preocupamos com medições destrutivas, onde a saída consiste apenas no resultado clássico da medição e não há especificação do estado quântico pós-medição do sistema que foi medido.

As medições não destrutivas, por outro lado, fazem exatamente isso. Especificamente, as medições não destrutivas descrevem não apenas as probabilidades dos resultados clássicos da medição, mas também o estado do sistema que foi medido condicionado a cada possível resultado. Note que o termo não destrutivo se refere ao sistema sendo medido, mas não necessariamente ao seu estado, que pode mudar significativamente como resultado da medição.

Em geral, para uma dada medição destrutiva, haverá múltiplas (na verdade, infinitamente muitas) medições não destrutivas que são compatíveis com a medição destrutiva dada, ou seja, as probabilidades dos resultados clássicos da medição coincidem precisamente com as da medição destrutiva. Portanto, não existe uma forma única de definir o estado quântico pós-medição de um sistema para uma dada medição.

Na verdade, é possível generalizar as medições não destrutivas ainda mais, de modo que elas produzam um resultado clássico da medição junto com uma saída de estado quântico de um sistema que não é necessariamente o mesmo que o sistema de entrada.

A noção de medição não destrutiva é uma abstração interessante e útil. No entanto, deve-se reconhecer que as medições não destrutivas sempre podem ser descritas como composições de canais e medições destrutivas — portanto, há um sentido em que a noção de medição destrutiva é a mais fundamental.

A partir do teorema de Naimark

Considere a simulação de uma medição geral como a que temos no teorema de Naimark. Uma forma simples de obter uma medição não destrutiva a partir dessa simulação é revelada pela figura anterior, onde o sistema $\mathsf{X}$ não é traçado para fora, mas faz parte da saída. Isso produz tanto um resultado clássico da medição $a\in\{0,\ldots,m-1\}$ quanto um estado quântico pós-medição de $\mathsf{X}.$

Vamos descrever esses estados em termos matemáticos. Estamos assumindo que o estado inicial de $\mathsf{X}$ é $\rho,$ de modo que após o sistema inicializado $\mathsf{Y}$ ser introduzido e $U$ ser aplicada, temos que $(\mathsf{Y},\mathsf{X})$ está no estado

\sigma = U \bigl(\vert 0\rangle \langle 0 \vert \otimes \rho\bigr) U^{\dagger} = \sum_{a,b=0}^{m-1} \vert a\rangle \langle b \vert \otimes \sqrt{P_a} \rho \sqrt{P_b}.

As probabilidades para os diferentes resultados clássicos aparecerem são as mesmas de antes — elas não podem mudar em função de decidirmos ignorar ou não $\mathsf{X}.$ Ou seja, obtemos cada $a\in\{0,\ldots,m-1\}$ com probabilidade $\operatorname{Tr}(P_a \rho).$

Condicionado ao resultado de medição $a$ ter sido obtido, o estado resultante de $\mathsf{X}$ é dado por esta expressão.

\frac{\sqrt{P_a} \rho \sqrt{P_a}}{\operatorname{Tr}(P_a \rho)}

Uma forma de ver isso é representar uma medição na base padrão de $\mathsf{Y}$ pelo canal completamente defasador $\Delta_m,$ onde a saída do canal descreve os resultados clássicos da medição como matrizes de densidade (diagonais). Uma expressão do estado que obtemos é a seguinte.

\sum_{a,b=0}^{m-1} \Delta_m(\vert a\rangle \langle b \vert) \otimes \sqrt{P_a} \rho \sqrt{P_b} = \sum_{a=0}^{m-1} \vert a\rangle \langle a \vert \otimes \sqrt{P_a} \rho \sqrt{P_a}.

Podemos então escrever esse estado como uma combinação convexa de estados produto,

\sum_{a=0}^{m-1} \operatorname{Tr}(P_a \rho)\, \vert a\rangle \langle a \vert \otimes \frac{\sqrt{P_a} \rho \sqrt{P_a}}{\operatorname{Tr}(P_a \rho)},

o que é consistente com a expressão que obtivemos para o estado de $\mathsf{X}$ condicionado a cada possível resultado de medição.

A partir de uma representação de Kraus

Existem seleções alternativas para $U$ no contexto do teorema de Naimark que produzem as mesmas probabilidades de resultado de medição, mas dão estados de saída de $\mathsf{X}$ completamente diferentes.

Por exemplo, uma opção é substituir $(\mathbb{I}_{\mathsf{Y}} \otimes V) U$ por $U,$ onde $V$ é qualquer operação unitária em $\mathsf{X}.$ A aplicação de $V$ a $\mathsf{X}$ comuta com a medição de $\mathsf{Y}$ , portanto as probabilidades dos resultados clássicos não mudam, mas agora o estado de $\mathsf{X}$ condicionado ao resultado $a$ se torna

\frac{V \sqrt{P_a} \rho \sqrt{P_a}V^{\dagger}}{\operatorname{Tr}(P_a \rho)}.

De forma mais geral, poderíamos substituir $U$ pela matriz unitária

\Biggl(\sum_{a=0}^{m-1} \vert a\rangle\langle a \vert \otimes V_a\Biggr) U

para qualquer escolha de operações unitárias $V_0,\ldots,V_{m-1}$ em $\mathsf{X}.$ Novamente, as probabilidades dos resultados clássicos não mudam, mas agora o estado de $\mathsf{X}$ condicionado ao resultado $a$ se torna

\frac{V_a \sqrt{P_a} \rho \sqrt{P_a}V_a^{\dagger}}{\operatorname{Tr}(P_a \rho)}.

Uma forma equivalente de expressar essa liberdade está conectada com as representações de Kraus. Ou seja, podemos descrever uma medição não destrutiva de $m$ resultados de um sistema com $n$ estados clássicos por uma seleção de matrizes de Kraus $n\times n$ $A_0,\ldots,A_{m-1}$ satisfazendo a condição típica para matrizes de Kraus.

\sum_{a = 0}^{m-1} A_a^{\dagger} A_a = \mathbb{I}_{\mathsf{X}} \tag{1}

Assumindo que o estado inicial de $\mathsf{X}$ é $\rho,$ o resultado clássico da medição é $a$ com probabilidade

\operatorname{Tr}\bigl(A_a \rho A_a^{\dagger}\bigr) = \operatorname{Tr}\bigl(A_a^{\dagger} A_a \rho \bigr)

e condicionado ao resultado ser $a$ , o estado de $\mathsf{X}$ se torna

\frac{A_a \rho A_a^{\dagger}}{\operatorname{Tr}(A_a^{\dagger}A_a \rho)}.

Note que isso é equivalente a escolher a operação unitária $U$ no teorema de Naimark da seguinte forma.

U = \begin{pmatrix} A_{0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] A_{1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] A_{m-1} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Na lição anterior, observamos que as colunas formadas pelos blocos $A_0,\ldots,A_{m-1}$ são necessariamente ortogonais, em virtude da condição $(1).$

Generalizações

Existem formas ainda mais gerais de formular medições não destrutivas do que as formas que discutimos. A noção de instrumento quântico (que não será descrita aqui) representa uma maneira de fazer isso.

Enunciado e prova do teorema​

Medições não destrutivas​

A partir do teorema de Naimark​

A partir de uma representação de Kraus​

Generalizações​

Enunciado e prova do teorema

Medições não destrutivas

A partir do teorema de Naimark

A partir de uma representação de Kraus

Generalizações