Hur fungerar PhotoMath?

CAVEAT: Jag arbetar inte för PhotoMath, jag vet inte vad deras algoritm är och jag har aldrig använt appen. Jag kollade just på webbplatsen, PhotoMath.net . Det är precis så jag skulle göra det.

Steg ett är optisk teckenigenkänning (OCR). Det är programmeringen som omvandlar bilden till en uppsättning tecken, till exempel x, 2, = och 4. Det är också programmeringen som "ser" att 2 är ett superscript associerat med x. OCR är vanligt i till exempel omvandling av tryckta böcker till e-böcker. Det är svårare att göra OCR med handskrift, eftersom det finns mycket mer variation i storlek och form på bokstäver, men det fungerar fortfarande ganska bra. Appen använder förmodligen ett speciellt, begränsat OCR-program som bara gör en begränsad uppsättning matematik. Webbplatsen visar bokstäver, siffror, lägg till, subtrahera, multiplicera, dela, krafter, rötter och likhetstecken. Att begränsa utbudet av möjligheter gör karaktärsigenkänningen lättare. Naturligtvis betyder det också att appen kan misslyckas om du bad den att läsa din inköpslista. Beroende på hur bra OCR-programmeringen är, kan appen kanske inte fungera om du pekar på en handskriven ekvation på ett svarta tavla.

Steg två är att lösa ekvationen. Det här är vad som vänder sig
x ^ 2 = 4
in
x = +/- 2
Det har funnits program för att göra det i mer än 30 år. Wolframs Mathematica är verkligen den mest kända. Ser Wolfram Mathematica. Appen kan ha en Mathematica-licens. Mer troligt hittade de programvara med öppen källkod som hanterar ekvationerna de förväntar sig att stöta på, kanske bara algebra.

Och det finns smarttelefonapp-programmering som tar en bild som ingång till OCR / matematik och sedan tar utgången tillbaka till telefonen.

En av nycklarna till kreativitet är förmågan att kombinera befintliga element till något nytt och användbart.

Lämna en kommentar